Logistic回归分析【共53张PPT】.pptVIP

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
五、 Logistic回归分析方法 基本思想同线性回归分析。 从所用的方法看,有强迫法、前进法、后退法和逐步法。在这些方法中,筛选变量的过程与线性回归过程的完全一样。但其中所用的统计量不再是线性回归分析中的F统计量,而是以上介绍的参数检验方法中的三种统计量之一。 为计算方便,通常向前选取变量用似然比或比分检验,而向后剔除变量常用Wald检验。 六、 Logistic回归的应用 危险/保健因素的筛选,并确定其作用大小。 预测:预测某种情况下或者某个病例,某特定事件发生的概率。 影响因素为分类变量时,用列联表形式 卡方检验 存在分类的混杂因素时,用Mantel-Haensze 但存在局限性(1)控制混杂因素,但无法描 述作用大小及方向(2)样本量要求大,单元 格划分太细(3)无法对连续性自变量的影响 进行分析 格划分太细(3)无法对连续性自变量的影响 Logistic回归 二分类 有序反应变量 Logistic回归 二分类 有序反应变量 分析因素xi为多分类变量时,为方便起见,常用1,2,…,k分别表示k个不同的类别。 比数比   OR=[P1/(1-P1)]/[P2/(1-P2)] (二)病例与对照匹配---条件logistic回归 Logit(P )取值范围扩展为(-?,+ -?) 条件Logistic回归 1:m配对资料 P=1 Logit(P)=Ln(1/0)=+无穷大 分析因素xi为等级变量时,如果每个等级的作用相同,可按计量资料处理:如以最小或最大等级作参考组,并按等级顺序依次取为0,1,2,…。 步骤是: 程序编辑窗主菜单 Analyze → 选 Regression (回归分析) → 选 Binary Logictic (两分类变量 Logictic 回归分析,出现 Logistic Regression 窗口 → 将 是否肿瘤选入右边的? Dependent (因变量)窗口中 → 将sex、age 、血脂、血压等均选入右边的 Covariats(协变量,这里是自变量) 窗口中, 对反应变量有影响的因素有n个,称为自变量X1,X2,…. 从所用的方法看,有强迫法、前进法、后退法和逐步法。 5 Logit(P)=Ln(0. 曲线回归时,往往采用变量变化,使得曲线直线化,再进行直线回归方程的拟合。 二分类Logistic对资料的要求 (1)反应变量为二分类的分类变量。(发病率等存在重复计数的指标不适用 (2)误差项服从二项分布(不是正态分布),不再使用最小二乘法进行参数估计,而使用最大似然法来解决方程的估计和检验问题) (3)观察对象相互独立 (4)所需样本数为自变量个数的5-10倍。 m:n配对资料 对反应变量有影响的因素有n个,称为自变量X1,X2,…. 能否考虑对所预测的因变量加以变换。 分析因素xi为多分类变量时,为方便起见,常用1,2,…,k分别表示k个不同的类别。 进而,优势比e(bi)的可信区间为 Logistic回归分析 而Wald检验未考虑各因素间的综合作用,在因素间有共线性时结果不如其它两者可靠。 Logistic回归系数的区间估计 1:1匹配又叫配对(pair matching), 1:2,┅ ,1:m匹配时称为匹配。 如二项分类,如某种疾病的患病与否 也称对数单位转换 (3)观察对象相互独立 似然比检验(likehood ratio test) 偏回归系数表示在其它自变量固定的条件下, 匹配或称配比(matching),即要求对照在某些因素或特征上与病例保持一致,目的是对两组比较时排除混杂因素的干扰。 分析实例 分析糖尿病患者继发肿瘤与否的影响因素,采用二分类Logistic 回归分析。 步骤是: 程序编辑窗主菜单 Analyze → 选 Regression (回归分析) → 选 Binary Logictic (两分类变量 Logictic 回归分析,出现 Logistic Regression 窗口 → 将 是否肿瘤选入右边的? Dependent (因变量)窗口中 → 将sex、age 、血脂、血压等均选入右边的 Covariats(协变量,这里是自变量) 窗口中, Forward: LR ( 向前逐步法:似然比法 likelihood? ratio,LR)→ 再击下方的 Save 钮,将 Predicted values、 Influence 与 Residuls 窗口中的预选项全勾选? → Continue → 再击下方的 Options 钮,将 Statistics and Plot 小窗口中的选项全勾选 → Continue →? OK 。 哑变量 自变量为多分类变量,与应变量之间通常不存在线性关系

文档评论(0)

爱分享的达人 + 关注
实名认证
文档贡献者

爱分享

1亿VIP精品文档

相关文档