第3讲logistic回归.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3讲logistic回归

安徽医科大学流行病与卫生统计学系 第三讲 logistic回归 logistic的主要内容 非条件logistic回归 条件logistic回归 多类结果的logistic回归 有序结果的累计比数logistic回归 logistic回归的正确应用 二分类logistic回归的SPSS过程 配对logistic回归的SPSS过程 多分类有序的logistic回归SPSS分析过程 logistic回归 模型简介 传统方法与logistic回归的关系 回归系数的解释 模型的估计与假设检验 建模策略 多元线性回归的适用条件 为什么要引入logistic回归模型 经典方法的局限性(如分层校正技术) 1.只能将因素分析2个或几个水平; 2.只能控制2-3个混杂因素的干扰,且各因素各水平的组合需要足够的样本含量; 3.只能判断因素对发病的影响是否存在,不能对危险因素的作用大小进行定量分析,同时也不能分析交互效应。 1 模型简介 P发病的概率, 0≤P≤1。 logistic回归模型 P发病的概率。    为“机会”或“优势”(odds) logit P为优势之对数(log odds) 和优势比 logistic回归模型的几种形式 2 传统方法与logistic回归 四格表资料(病例对照)与logistic的关系 分层四格表资料与logistic的关系 例 四格表资料 探讨妇女使用雌激素与患子宫内膜癌的病例-对照研究 四格表资料的logistic回归 X=1 表示使用过雌激素 X=0 表示未使用过雌激素 四格表资料与logistic回归 X=1时 X=0 时 例 分层四格表资料与logistic回归 Mantel-Haenszel法结果 logistic回归结果 传统方法与logistic回归的关系 单因素病例对照研究的OR,与logistic回归等价; 分层病例对照研究的ORMH,与logistic回归结果近似。 logistic回归是传统方法的扩展。 混杂因素的控制 控制某混杂因素,实际上就是将该因素纳入模型。 在解释暴露因素的影响时,该混杂因素实际上是控制了。 3 回归系数的解释 logistic回归中的系数?,与OR有关! 一个暴露因素时,当暴露为1,非暴露为0时, ?=ln(OR) 回归系数的解释 一个暴露因素时,当暴露为c1,非暴露为c0时, 回归系数的解释 一个暴露因素:暴露为1,非暴露为0。 一个混杂因素时:水平数分别为:1,2,… 例 食道癌危险因素研究 在食道癌危险因素研究中,采用病例-对照设计,调查了200个食道癌患者和788个非食道癌患者,调查因素及编码如下。 logistic回归系数的解释 回归系数的解释 等级变量:一般以最小等级或最大等级作为参考组,并按等级顺序依次取为0,1,2,…。此时,exp(?)表示X增加一个等级时的优势比, exp(k?)表示增加k个等级时的优势比。 连续性变量:表示增加1(个计量单位)时的优势比(在实际评价中意义不大)。 回归系数的解释 多分类变量:哑变量(dummy variable) x=1时:D1=0, D2=0, D3=0 表示A型血 x=2时:D1=1, D2=0, D3=0 表示B型血 x=3时:D1=0, D2=1, D3=0 表示AB型血 x=4时:D1=0, D2=0, D3=1 表示O型血 exp(?1) 表示B与A比之OR; exp(? 2) 表示AB与A比之OR; exp(? 3) 表示O与A比之OR。 ?的解释(一般性了解)-在实际分析中意义不大 在横断面调查研究中, 表示基线状态下,个体的患病率; 在队列研究中,表示基线状态下,个体的发病率; 在成组病例-对照研究中,表示基线状态下,病例在研究对象中所占比例; 在1:1配比病例-对照研究中,?=0,该数值等于0.5,表示基线状态下,病例在研究对象中占一半; 4 模型的估计及假设检验 线性模型时,用最小二乘估计(LSE) logistic回归模型,用极大似然估计。 (maximum likelihood estimate, MLE) Wald检验 Wald检验实际上是比较估计系数与0的差别来进行的,其检验统计量为: Wald的?2检验是 z 的平方。 似然比检验(likelihood ratio test) 似然比检验是通过比较两个相嵌套模型的对数似然函数统计量G(又称Deviance)来进行的,其统计量为: G=GP-GK =-2ln(LP)+2ln(LK) 其中,模型P中的变量是模型K中变量的一部分,另一部分就是我们要检验的变量(模型P嵌套

文档评论(0)

youshen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档