网站大量收购独家精品文档,联系QQ:2885784924

医学统计学上课第14章-2logistic回归.pptx

  1. 1、本文档共91页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第14章-2 Logistic回归;;为了解农村脑卒中的患病情况以及有关的影响因素,随机抽取了某农村6006名45岁以上农民进行了问卷调查。应变量脑卒中y(未患= 0 ,患病=1)的7个拟选影响因素及其数量化见表14-1。 ;表14-2 6006名农民现场调查结果;采用多重线性回归分析,建立回归方程为 进入方程的变量为性别和高血压,偏回归系数均为正值,表明脑卒中患病与性别和高血压史呈正相关(P<0.05); 问 题 ;3. 采用的统计方法是否正确? 为什么? 该资料的统计方法不正确 因为如果将可能的危险因素与脑卒中的患病频率P直接描述为线性关系, 进行线性回归分析, 则建立的回归模型形式为 由于P 的取值为0-1, 而由自变量建立的方程所得的 P 值会出现大于1或小于0的情况,因而线性回归方程就不合适了 4. 该资料应采用何种统计方法? Logistic 回归分析;第一节 概 述;(一) Logistic回归(logistic regression) 1. 类型 属于概率型非线性回归 2. 用途 研究应变量 y (分类变量)与一些影响因素 xi之间关系;(一) Logistic回归(logistic regression) 3. Logistic回归模型对变量的要求 1)应变量:分类变量(最好数量化为二项分类) a. 二分类变量、无序多分类变量——计数资料 b. 有序多分类变量——等级资料 2)自变量:计量、计数和等级资料;(二) Logistic回归分析的种类 ;(三)Logistic回归模型(分类评定模型、逻辑回归模型) 以二分类Logistic回归为例 1. 设研究所关注的结局事件(如患病或治愈)是否发生用应变量 y 表示 2. 设 y 为二分类变量 y = 1 :该结局事件发生,概率为P y = 0 :该结局事件未发生,概率为1-P;(三)Logistic回归模型(分类评定模型、逻辑回归模型) 3. 二分类Logistic回归概率模型 4. 二分类 Logistic回归模型 ln[P/(1-P)]与各 x 间的关系:线性关系 P在(0,1)之间变动时,logit(P)在(-∞,+∞)之间变动;(三)Logistic回归模型(分类评定模型、逻辑回归模型) 5. 模型参数的意义 β0:常数项,表示所有自变量均为 0 时,logit(P)的值 βi :偏回归系数,表示在控制其他自变量时,自变量xi 变化一个单位所引起的 logit(P) 的改变量 ;(三)Logistic回归模型(分类评定模??、逻辑回归模型) 6. 建立Logistic回归模型的意义(补充内容) 1)Logistic回归模型将原本非线性的关系通过适当的变量变换,转化为线性关系 2)可以根据 b 值求得 OR 值 3)可同时控制多个因素 4)定量解释应变量与自变量之间的联系 5)可以分析变量间的交互效应;(一) 参数估计 1. 参数估计的内容 1) 偏回归系数βi 的区间估计(P380第4条) 2) 偏回归系数估计值的标准误 SE(bi ) 3) 优势比 OR 的区间估计(补充内容) 2. 参数估计的方法 1) 加权最小二乘法(WLS) 2) 线性判别法 3) 最大似然法(ML):常用的回归参数(βi、 OR )估计方法;(一) 参数估计 最大似然法估计的基本思想 1. 先建立似然函数 L 和对数似然函数lnL 2. 采用非线性迭代法使其似然函数或对数似然函数达到极大值,此时参数的取值称为最大似然估计值 3. 参数估计值的标准误的估计, 是以似然函数 L 的一阶和二阶导函数建立的估计公式,采用递推方法计算;(一) 参数估计 1. 偏回归系数 ?i 的区间估计 根据正态分布理论进行偏回归系数的区间估计 总体偏回归系数 ?i 的(1-?)可信区间(CI)为 总体偏回归系数 ?i 的 95% 可信区间(CI)为;2. 优势比(odds ration, OR)(P380第四条) 1) 优势(odds)(又称比数) 指某事件的发生概率P与不发生概率1-P之比 2) 优势比(又称比值比) 指某事件在两种不同条件下的优势之比 在Logistic回归模型中,自变量 xi 增加一个单位,对应的优势比为;2. 优势比(odds ration, OR) 4) 根据 OR 值判断 x 对 y 的影响 (1) 当βi 为正→ORi>1→ xi 增加1个单位后与增加前相比,事件发生的优势比大于1→ xi 增大时事件发生 (2) 当βi=0 → ORi=1

文档评论(0)

158****9376 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档