网站大量收购独家精品文档,联系QQ:2885784924

北京大学医学部医学统计学进阶1第3讲 logistic回归PPT.ppt

北京大学医学部医学统计学进阶1第3讲 logistic回归PPT.ppt

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北京大学医学部医学统计学进阶1第3讲 logistic回归PPT

八、 Logistic回归的应用 危险/保护因素的筛选,并确定其作用大小。 预测:预测某种情况下或者某个病例,某特定事件发生的概率。 九、注意事项 应用条件 1. 各观察对象间相互独立; 2. logit P与自变量呈线性关系。 变量的取值形式:变量采取不同的取值形式,参数的含义、量值及符号都可能发生变化。 二分类变量:0、1(连续性变量或哑变量) 多分类无序变量:哑变量 多分类有序(等级)变量:连续性变量或哑变量 连续性变量:转换为分类变量较易解释OR值的意义。 样本量:一般不小于200例,配对资料对子数n大于等于变量的20倍,否则回归系数的估计是有偏性的。 不应单纯依赖程序筛选变量,要注意变量的医学意义。 多元线性回归分析与Logistic回归分析都是实际工作中常用的方法,用于影响因素分析时,多元线性回归的因变量是连续变量,而Logistic回归的因变量是分类变量;两种方法的自变量均可为连续变量或分类变量,当为多分类变量时,均需设相应的哑变量。 例:比较新疗法与旧疗法治疗某种疾病的疗效。现对40例患者随机分组,分别接受新疗法和旧疗法治疗。根据专业知识,患者的病情严重程度、年龄对疗效也有影响。如何评价新旧疗法的疗效(见数据文件logistic.sav)?(注:作为举例,本例样本量仅为40例,由于样本量太小,Logistic回归的结论仅作为参考) 十、 实例 变量说明:Y:治愈情况,1=治愈;0=未治愈;;X1:病情严重程度,0=不严重,1=严重;X2:年龄。X3:治疗方法,0=新疗法,1=旧疗法。 二值 Logistic回归 因变量 协变量(自变量) 后退法筛选变量 OR的95%置信区间 拟合分类表 对模型的检验 * Logistic回归分析 北京大学公共卫生学院 王海俊 副教授 Logistic Regression 什么是适宜的统计方法? 1、与研究目的有关 2、与资料类型有关 当研究目的为建立某病发生概率与自变量关系的统计模型时,是否可用线性回归模型?为什么? P 某事件发生的概率 X 可能与该事件发生有关的因素 P= α + ?1X1 + β2X2+ β3X3 + … +βmXm 一、 Logistic回归模型 Logistic回归是描述一些自变量X和一个分类变量之间关系的数学模型。 应变量:二分类变量,若令应变量为y,则常用y=1表示“发病”,y=0表示“不发病”(在病例对照研究中,分别表示病例组和对照组)。 自变量:可以为分类变量,也可以为连续变量。 与线性回归分析的主要区别: 应变量为连续计量资料 Logistic回归的分类 二分类 多分类 条件Logistic回归 非条件Logistic回归 Logistic function Z = α + ?1X1 + β2X2+ β3X3 + … +βmXm Logistic function f(z) 取值 0-1,可描述/预测概率,Logistic 模型是概率模型 Logistic function f(z) 呈S-形曲线,符合流行病学对危险因素与疾病风险关系的认识 Logistic回归模型特点 Logit变换(也称对数单位转换) logit P= = P=P(y=1|x),为发病概率; 1-P=P(y=0|x),为不发病概率。 二、参数估计 最大似然估计法(Maximum likehood estimate)  似然函数:L= ? P(y=1|x) P(y=0|x) 对数似然函数: lnL=∑(ln P)=ln P1+ln P2+…+ln Pn 非线性迭代方法——Newton-Raphson法 通过迭代法估计一组参数(?0, ?1 , ?2 ….. ?m)使L达到最大。 三、回归系数的意义 单纯从数学上讲,与多元线性回归分析中回归系数的解释并无不同,亦即βi表示xi改变一个单位时, logit P的平均变化量。 流行病学一些概念:  设P表示暴露因素X时个体发病的概率,则发病的概率P与未发病的概率1-P 之比为优势或比值(odds), logit P就是odds的对数值。 比值    Odds=P/(1-P) 比值比   OR=[P1/(1-P1)]/[P0/(1-P0)] 比值比 Odds Ratio Odds=P/(1-P) 暴露组: P1=a/(a+b), 1-P1= b/(a+

文档评论(0)

erfg4eg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档