- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[医学]北京大学医学部医学统计学进阶1第3讲 logistic回归
Logistic回归分析 北京大学公共卫生学院 王海俊 副教授 什么是适宜的统计方法? 1、与研究目的有关 2、与资料类型有关 当研究目的为建立某病发生概率与自变量关系的统计模型时,是否可用线性回归模型?为什么?P 某事件发生的概率X 可能与该事件发生有关的因素 P= 一、 Logistic回归模型 Logistic回归是描述一些自变量X和一个分类变量之间关系的数学模型。 应变量:二分类变量,若令应变量为y,则常用y=1表示“发病”,y=0表示“不发病”(在病例对照研究中,分别表示病例组和对照组)。 自变量:可以为分类变量,也可以为连续变量。 与线性回归分析的主要区别: 应变量为连续计量资料 Logistic回归的分类 二分类 多分类 条件Logistic回归 非条件Logistic回归 Logistic回归模型 Logistic function Logistic function f(z) 取值 0-1,可描述/预测概率,Logistic 模型是概率模型 Logistic function f(z) 呈S-形曲线,符合流行病学对危险因素与疾病风险关系的认识 Logit变换(也称对数单位转换) logit P= = 二、参数估计 最大似然估计法(Maximum likehood estimate) 似然函数:L= ? P(y=1|x) P(y=0|x) 对数似然函数: lnL=∑(ln P)=ln P1+ln P2+…+ln Pn 非线性迭代方法——Newton-Raphson法 通过迭代法估计一组参数(?0, ?1 , ?2 ….. ?m)使L达到最大。 三、回归系数的意义 单纯从数学上讲,与多元线性回归分析中回归系数的解释并无不同,亦即βi表示xi改变一个单位时, logit P的平均变化量。 流行病学一些概念: 设P表示暴露因素X时个体发病的概率,则发病的概率P与未发病的概率1-P 之比为优势或比值(odds), logit P就是odds的对数值。 比值比 Odds Ratio Odds=P/(1-P) 暴露组: P1=a/(a+b), 1-P1= b/(a+b) Odds=a/b 非暴露组: P0=c/(c+d), 1-P0= d/(c+d) Odds=c/d Odds Ratio (OR) 相对危险度(relative risk): RR=P1/P0 当一种病的死亡率(或发病率)较小,近似于零时,1-P≈1,则有: OR≈RR=P1/P0 Logistic回归中的常数项(β0)表示,在不接触任何潜在危险/保护因素条件下,效应指标发生与不发生事件的概率之比的对数值。 Logistic回归中的回归系数(βi )表示,某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数变化值,即OR的对数值。 Logistic回归系数的意义 分析因素xi为二分类变量时, 暴露xi =1,非暴露xi =0, 则Logistic回归中xi的系数βi就是暴露与非暴露优势比的对数值. 即,OR=exp(βi)=e βi βi = 0时,OR=1,Xi对疾病不起作用; βi 0时,OR1,Xi是疾病的危险因素; βi 0时,OR1,Xi是疾病的保护因素。 分析因素xi为多分类无序变量时,为方便起见,常用1,2,…,k分别表示k个不同的类别。进行Logistic回归分析前需将该变量转换成k-1个指示变量或哑变量(design/dummy variable),这样指示变量都是一个二分变量,每一个指示变量均有一个估计系数,即回归系数,其解释同前。 分析因素xi为多分类有序(等级)变量时: 如果每个等级的作用相同,可按计量资料处理:如以最小或最大等级作参考组,并按等级顺序依次取为0,1,2,…。此时, eβi 表示xi增加一个等级时的优势比, e(k*βi)表示xi增加k个等级时的优势比。 如果每个等级的作用不相同,则按多分类无序资料处理。 分析因素xi为连续性变量时, eβi表示xi增加一个计量单位时的优势比。 多因素Logistic回归分析时,对回归系数的解释都是指在其它所有自变量固定的情况下
您可能关注的文档
最近下载
- 水闸横剖面图识读水利工程图识读与绘制.pptx VIP
- 国家建筑标准设计图集20S515 钢筋混凝土及砖砌排水检查井.pdf VIP
- 救援技术毕业论文题目(647个).doc VIP
- l临床医生三基考试试题及答案.doc VIP
- 苏教版高一生物必修一知识点总结.doc VIP
- 12J7-3-内装修吊顶标准规范(OCR).pdf VIP
- 全国翻译专业资格(水平)考试--CATTI精品课件.ppt VIP
- 《深化国有企业改革》课件.ppt VIP
- 基于AI技术的增强型汽车动力电池预测方法及系统.pdf VIP
- (2025秋新版)部编版三年级道德与法治上册《第10课《公共场所的文明素养》 教学设计.docx VIP
原创力文档


文档评论(0)