- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[医药卫生]第十九章 logistic回归.ppt
Logistic回归分析 流行病学与卫生统计学教研室 姚 雪 梅 Logistic回归分析 Logistic回归概述 非条件Logistic回归 条件Logistic回归 Logistic回归在医学中的应用 一、Logistic回归概述 医学研究中,分析变量间的相互关系是探索疾病病因的重要途径。 多元线性回归要求应变量为连续性变量 Logistic回归是分析应变量为分类变量的一种常用的多元统计方法。 举例:生存与死亡、感染与未感染、患病与未患病等 一、Logistic回归概述 当应变量为分类变量,能否建立与多个自变量的线性回归模型? 不满足正态性、线性 以往学习的对分类变量资料进行统计分析有哪些? 一、Logistic回归概述 Logistic回归分类 按自变量(因素)多少分 单因素Logistic回归 多因素(元)Logistic回归 一、Logistic回归概述 Logistic回归分类 按应变量及设计类型分 二分类Logistic回归 成组设计二分类Logistic回归(非条件Logistic回归) 配对设计二分类Logistic回归(条件二分类Logistic回归) 无序多分类Logistic回归 有序多分类Logistic回归 二、非条件Logistic回归 数据形式 Logistic回归模型的一般形式 回归系数的解释 Logistic回归参数估计 Logistic回归模型及回归系数的假设检验 (一)非条件Logistic回归分析数据形式 (一)非条件Logistic回归分析数据形式 (二)Logistic回归模型的一般形式 以Y表示二分类应变量,Y的量化取值为: Y=1 表示患病、阳性、死亡 Y=0 表示未患病、阴性、生存 令 P(Y=1)=π; P(Y=0)=1-π 如何建立π与多个自变量Xm线性关系? (二)Logistic回归模型的一般形式 对应变量π作Logit变换,则: (二)Logistic回归模型的一般形式 模型形式1: Β0为常数项,βj为偏回归系数(简称回归系数) 可解释各自变量对logit(π)的影响及贡献大小 (二)Logistic回归模型的一般形式 模型形式2: 此形式为概率预测模型,给定自变量的取值时,可估计概率 (二)Logistic回归模型的一般形式 例19-1: (三)回归系数的解释 在医学研究中, logit(π)有其特殊涵义,使得对回归系数βj的解释更具有实际意义,使Logistic回归模型应用广泛。 (五)回归系数的解释 举例说明:单因素Logistic回归 (三)回归系数的解释 优势(比值) odds 出现某种结果的概率与不出现某种结果的概率之比。即odds= π/(1- π) 优势比(比值比)odds ratio OR OR为两个优势之比。当疾病的发病率较低时(10%), OR近似等于RR,可用来描述危险因素与疾病的关联性。 OR1 危险因素 OR=1 对疾病无作用 OR1 保护因素 (三)回归系数的解释 举例说明:多因素Logistic回归 (三)回归系数的解释 回归系数βj的统计学意义 固定其他自变量时(其他自变量保持不变时),自变量Xj 改变一个单位得到的比值比的自然对数 ORj=exp(βj) 也称调整比值比。它表示扣除其他自变量影响后, Xj 的作用。 βj 0时, ORj 1 , 危险因素 βj =0时, ORj =1 ,无作用 βj 0时, ORj 1 , 保护因素 (三)回归系数的解释 OR的解释OR=exp(β),与自变量的编码关系密切 当自变量为二分类变量时,编码为0-1或1-2 注意:对应变量Y=1的影响大的自变量的水平,编码也大。 举例:例19-1的X2、X3 分别作单因素Logistic回归 (三)回归系数的解释 OR的解释OR=exp(β),与自变量的编码关系密切 当自变量为连续型变量时,不需编码 表示自变量X每增加一个单位得到的比值比的自然对数 例如:前列腺癌患者淋巴组织有无转移与年龄(X)回归模型 实际工作中,常把连续型变量→等级资料来解释。例19-2 (三)回归系数的解释 OR的解释OR=exp(β),与自变量的编码关系密切 当自变量为有序分类变量时,一般按等级对疾病影响的顺序由大到小编码。(各等级对应变量的影响是线性变化的) 举例:361页例19-3 例:淋巴结有无转移与某恶性肿瘤分级Ⅰ、Ⅱ、Ⅲ、Ⅳ的回归模型,表示肿瘤分级每增加一个等级,淋巴结转移危险性增加1.69倍。 (三)回归系数的解释 OR的解释OR=exp(β),与自变量的编码关系密切 当自变量为无序分类变量时,常用哑变量(假变量)编码;无序分类变量的水平数(分类数)为n,需产生n-1个哑变量。
文档评论(0)