- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
北京大学医学部医学统计学进阶1第3讲 logistic回归
Logistic回归分析;什么是适宜的统计方法?;当研究目的为建立某病发生概率与自变量关系的统计模型时,是否可用线性回归模型?为什么?P 某事件发生的概率X 可能与该事件发生有关的因素 P=;一、 Logistic回归模型;Logistic回归的分类
二分类
多分类
条件Logistic回归
非条件Logistic回归;Logistic回归模型
;
Logit变换(也称对数单位转换)
logit P= =
;二、参数估计;三、回归系数的意义;流行病学一些概念:
设P表示暴露因素X时个体发病的概率,则发病的概率P与未发病的概率1-P 之比为优势或比值(odds), logit P就是odds的对数值。;比值比 Odds Ratio;相对危险度(relative risk): RR=P1/P0
当一种病的死亡率(或发病率)较小,近似于零时,1-P≈1,则有:
OR≈RR=P1/P0
;Logistic回归中的常数项(β0)表示,在不接触任何潜在危险/保护因素条件下,效应指标发生与不发生事件的概率之比的对数值。
Logistic回归中的回归系数(βi )表示,某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数变化值,即OR的对数值。;Logistic回归系数的意义;分析因素xi为多分类无序变量时,为方便起见,常用1,2,…,k分别表示k个不同的类别。进行Logistic回归分析前需将该变量转换成k-1个指示变量或哑变量(design/dummy variable),这样指示变量都是一个二分变量,每一个指示变量均有一个估计系数,即回归系数,其解释同前。;分析因素xi为多分类有序(等级)变量时:
如果每个等级的作用相同,可按计量资料处理:如以最小或最大等级作参考组,并按等级顺序依次取为0,1,2,…。此时, eβi 表示xi增加一个等级时的优势比, e(k*βi)表示xi增加k个等级时的优势比。
如果每个等级的作用不相同,则按多分类无序资料处理。
分析因素xi为连续性变量时, eβi表示xi增加一个计量单位时的优势比。; 多因素Logistic回归分析时,对回归系数的解释都是指在其它所有自变量固定的情况下的优势比。
存在因素间交互作用时, Logistic 回归模型中各自变量与疾病关系的联合作用为乘法模型,回归系数的解释变得更为复杂,应特别慎重。; 样本量较大时,Logistic回归系数bi服从u分布。因此其可信区间为
进而,优势比OR(ebi )的可信区间为
;四、模型检验和评价;Wald检验( wald test)
即广义的t检验,统计量为u
u服从正态分布,Sbi即为标准误。
同理,Logistic回归系数的区间估计
;似然比检验:卡方检验
Wald检验:只能对单个b检验;未考虑各因素间的综合作用,在因素间有共线性时结果不如前者可靠。
大样本时两种方法结果一致。;对模型拟合的优良性评价:
(1)拟合分类表(Classification Table)
根据Logistic回归模型,对样本重新判别分类,符合率越高,模型拟合越好。注意:Logistic回归用于判别分类很粗劣,此法仅作参考。
;(2)最大似然函数值L
SPSS报告:“-2LogLikelihood”
报告值越大,意味着回归方程的似然值越小(L ?1) ,标志模型的拟合程度越差;
很高的-2L值说明:
1)可能Logistic回归不合适;
2)可能影响因变量的主要因素未被考虑在内。;五、 变量筛选;六、条件Logistic回归;配对设计的Logistic回归模型
其中不含常数项。
;七、其他Logistic 回归模型;八、 Logistic回归的应用;九、注意事项;变量的取值形式:变量采取不同的取值形式,参数的含义、量值及符号都可能发生变化。
二分类变量:0、1(连续性变量或哑变量)
多分类无序变量:哑变量
多分类有序(等级)变量:连续性变量或哑变量
连续性变量:转换为分类变量较易解释OR值的意义。
样本量:一般不小于200例,配对资料对子数n大于等于变量的20倍,否则回归系数的估计是有偏性的。
不应单纯依赖程序筛选变量,要注意变量的医学意义。;
多元线性回归分析与Logistic回归分析都是实际工作中常用的方法,用于影响因素分析时,多元线性回归的因变量是连续变量,而Logistic回归的因变量是分类变量;两
您可能关注的文档
最近下载
- 机械设计图形处理和性能分析实验-南京航空航天大学研究生实验课程汇报.doc VIP
- 实施指南《GB_T22919.6 - 2024水产配合饲料第6部分:石斑鱼配合饲料》实施指南.docx VIP
- 通风管道技术施工技术规程(风管制作).doc VIP
- 抖音信息流推广方案课件.pptx VIP
- 半导体物理学(刘恩科第七版) 全套课件.ppt VIP
- 2025年人教版七年级下册英语语法填空专练(含答案).docx VIP
- 大班数学:单双数(找朋友).ppt VIP
- 儿童社区获得性细菌性脑膜炎诊断与治疗专家共识.pdf
- 部编版四年级上册《道德与法治》年度教学目标计划.docx VIP
- 《股静脉采血技巧》课件 .ppt VIP
文档评论(0)