北京大学医学部医学统计学进阶1第3讲 logistic回归.pptVIP

北京大学医学部医学统计学进阶1第3讲 logistic回归.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
北京大学医学部医学统计学进阶1第3讲 logistic回归

Logistic回归分析;什么是适宜的统计方法?;当研究目的为建立某病发生概率与自变量关系的统计模型时,是否可用线性回归模型?为什么? P 某事件发生的概率 X 可能与该事件发生有关的因素 P=;一、 Logistic回归模型;Logistic回归的分类 二分类 多分类 条件Logistic回归 非条件Logistic回归;Logistic回归模型   ; Logit变换(也称对数单位转换) logit P= = ;二、参数估计;三、回归系数的意义;流行病学一些概念:  设P表示暴露因素X时个体发病的概率,则发病的概率P与未发病的概率1-P 之比为优势或比值(odds), logit P就是odds的对数值。;比值比 Odds Ratio;相对危险度(relative risk): RR=P1/P0 当一种病的死亡率(或发病率)较小,近似于零时,1-P≈1,则有: OR≈RR=P1/P0 ;Logistic回归中的常数项(β0)表示,在不接触任何潜在危险/保护因素条件下,效应指标发生与不发生事件的概率之比的对数值。 Logistic回归中的回归系数(βi )表示,某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数变化值,即OR的对数值。;Logistic回归系数的意义;分析因素xi为多分类无序变量时,为方便起见,常用1,2,…,k分别表示k个不同的类别。进行Logistic回归分析前需将该变量转换成k-1个指示变量或哑变量(design/dummy variable),这样指示变量都是一个二分变量,每一个指示变量均有一个估计系数,即回归系数,其解释同前。;分析因素xi为多分类有序(等级)变量时: 如果每个等级的作用相同,可按计量资料处理:如以最小或最大等级作参考组,并按等级顺序依次取为0,1,2,…。此时, eβi 表示xi增加一个等级时的优势比, e(k*βi)表示xi增加k个等级时的优势比。 如果每个等级的作用不相同,则按多分类无序资料处理。 分析因素xi为连续性变量时, eβi表示xi增加一个计量单位时的优势比。; 多因素Logistic回归分析时,对回归系数的解释都是指在其它所有自变量固定的情况下的优势比。 存在因素间交互作用时, Logistic 回归模型中各自变量与疾病关系的联合作用为乘法模型,回归系数的解释变得更为复杂,应特别慎重。; 样本量较大时,Logistic回归系数bi服从u分布。因此其可信区间为 进而,优势比OR(ebi )的可信区间为 ;四、模型检验和评价;Wald检验( wald test)   即广义的t检验,统计量为u   u服从正态分布,Sbi即为标准误。  同理,Logistic回归系数的区间估计  ;似然比检验:卡方检验 Wald检验:只能对单个b检验;未考虑各因素间的综合作用,在因素间有共线性时结果不如前者可靠。 大样本时两种方法结果一致。;对模型拟合的优良性评价: (1)拟合分类表(Classification Table) 根据Logistic回归模型,对样本重新判别分类,符合率越高,模型拟合越好。注意:Logistic回归用于判别分类很粗劣,此法仅作参考。 ;(2)最大似然函数值L SPSS报告:“-2LogLikelihood” 报告值越大,意味着回归方程的似然值越小(L ?1) ,标志模型的拟合程度越差; 很高的-2L值说明: 1)可能Logistic回归不合适; 2)可能影响因变量的主要因素未被考虑在内。;五、 变量筛选;六、条件Logistic回归;配对设计的Logistic回归模型 其中不含常数项。 ;七、其他Logistic 回归模型;八、 Logistic回归的应用;九、注意事项;变量的取值形式:变量采取不同的取值形式,参数的含义、量值及符号都可能发生变化。 二分类变量:0、1(连续性变量或哑变量) 多分类无序变量:哑变量 多分类有序(等级)变量:连续性变量或哑变量 连续性变量:转换为分类变量较易解释OR值的意义。 样本量:一般不小于200例,配对资料对子数n大于等于变量的20倍,否则回归系数的估计是有偏性的。 不应单纯依赖程序筛选变量,要注意变量的医学意义。; 多元线性回归分析与Logistic回归分析都是实际工作中常用的方法,用于影响因素分析时,多元线性回归的因变量是连续变量,而Logistic回归的因变量是分类变量;两

文档评论(0)

djdjix + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档