网站大量收购独家精品文档,联系QQ:2885784924

logistic回归模型及其应用.pptVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
logistic回归模型及其应用 宁波大学医学院 沈其君 第一节 0-1反应变量与logistic模型结构 一.问题的提出 病例-对照研究,如何分析疾病发生与因素的关系? 1.单因素:OR与 局限性: a.只能研究1个危险因素; b.只能得出定性结论。 2.多因素分析: (1)可用分层分析M-H法 局限性: a.不能分析交互作用 b.容易出现0值:当混杂因素较多时,会导致部分层中某个格子频数为0,如合并反而不能很好的分析问题。 (2)线性回归分析:由于因变量是分类变量,不能满足其正态性要求。有些自变量对因变量影响并非线性。 3.回归模型作用 (1)描述:描述某种现象与其影响因素的数量依存关系。 (2)因素分析:寻找影响有显著性的因素。 (3)预测和控制:有些自变量易测,因变量难测。可以通过把自变量代入回归方程对因变量及其波动范围进行估计。控制主要是根据回归方程进行逆运算。 (4)没有对所使用的自变量值量度加以限制,只要求每个自变量不能是其它自变量的完全线性组合。 二.logit变换与logistic模型 1.对于病例-对照资料,从专业角度认为可能对疾病发生有影响的因素(可疑因素)。 2.建立线性模型存在的问题 (1)b0,b1……bp取值上有差别,自变量取值太窄。(由于线性概率模型估计的事件概率值在遇到很大或是很小的x时可能超出[0,1]区间) (2)对变量做线性模型只是粗略研究,P(D=1)与X1,X2…XP关系形式不正确。(因为线性概率模型是线性的,即无论x取什么值,其回归系数都应是常数,而其是非线性概率模型,线性概率模型不能拟合这种非线性模型) 3.实验研究—剂量反应关系 (1)取100只小鼠,随机分成10组,染毒(吸入、灌胃、注射、皮肤接触等)后研究死亡率剂量。 P=1/1+e-(a+bx) =a+bx 率 S型曲线 剂量 (2)急性实验与慢性实验:不同剂量反应关系 4.人群的发病与危险因素关系类似于染毒实验 logit(P)= =b0+b1x1+…b?b? 目的:(1)描述疾病与因素间的关系;因素分析;预测。 (2)x1…xp自变量 (3)b0,表示截距,b1…bp表示回归系数 5.用logistic模型描述疾病因素关系的理由 (1)logistic曲线能较好反应剂量反应关系,可把人群发病与危险因素类似看作。 (2)logistic变换使P在0到1之间转变为P在负无穷到正无穷之间,使得自变量取值及参数估计在数值上不受限制。 (3)logistic模型历史悠久,有许多成功的例子说明此模型合适。 (4)模型的回归系数bi与OR有直接联系,有更好的流行病学意义。 6.应用与发展 病例-对照研究(常用) 队列研究 横断面研究 临床资料,实验设计资料 确切logistic模型(小样本) 多分类:无序多分类和有序多分类。 第二节 流行病学意义 一、模型形式 (1) logit(P)= ln(p/1-p)=b0+b1x1+…b?b? (2)P/1-P=eb0+b1x1+…b?x?=eb0*eb1x1*…eb?x? eb1x1*…eb?x?表示两层含义: a. xβ作用 b.之间是乘积关系 二. 流行病学意义 1.(1) 用模型描述因素与疾病发生之间的关系 (2) 因素分析与病因探索 (3) 预测发病率 (4) 推广至其他领域:临床结果,实验效应。 (5) 危险因子与变量设计有关。 2.b0,b1-bm在队列研究中的含义 暴露组 P(D=1│X=1)= 1-P=1- = odds = = 队列研究中eb0叫基准危险(无任何危险状态)。 非暴露 P(D=1│X=0)= 1-P=1- = OR=eb 对于一个二分类变量它的回归系数取指数后就是OR (2)病例对照研究 OR = eb 只有b有含义b0无含义。 eb0 没有基础风险,受到抽样比的影响,不能用于预测。 3.其它 (1) 多分类 x=(0,1,2,3 ) eb=O

您可能关注的文档

文档评论(0)

新起点 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档