第20章logistic回归分析.ppt-济宁医学院公共卫生学院.pptVIP

第20章logistic回归分析.ppt-济宁医学院公共卫生学院.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第20章logistic回归分析.ppt-济宁医学院公共卫生学院

Logistic 回归分析 Logistic Regression Analysis 复习: 线性回归分析对反应变量的要求 医学研究中经常遇到分类型变量,例如: 二分类变量: 生存与死亡 有病与无病 有效与无效 感染与未感染 多分类有序变量: 疾病程度(轻度、中度、重度) 治愈效果(治愈、显效、好转、无效) 多分类无序变量: 手术方法(A、B、C) 就诊医院(甲、乙、丙、丁) 医学研究者经常关心的问题诸如: 吸烟是否影响肺癌的发病? 年龄和糖尿病的发病有无关系? 哪些因素导致了手术后有的人感染,而有的人不感染? 哪些因素导致了某种治疗方法出现治愈、显效、好转、无效等不同的效果? 这些应该是属于回归分析问题! 但是这种回归分析问题不能借助于线性回归模型,因为反应变量的假设条件遭到破坏 能否找到一种其他形式的模型y=f(x)来描述分类变量y和x之间依存关系呢? “转换一个角度来解决这个问题” 主要内容 Logistic 回归模型的基本概念 Logistic回归的参数估计及假设检验 Logistic回归分析的分类 Logistic回归的应用 第一节 Logistic 回归模型的基本概念 一、 Logistic 回归的实例 二、 Logistic 回归模型的基本结构 1970年,Cox引入了Logit变换 请注意其右侧仍然可以写成线性的形式! 大量实践证明,LogitP往往和自变量呈线性关系。 已经成为了分类变量的标准建模方法。 多变量的Logistic回归模型 Logistic 回归概念 是分类数据统计分析的一种重要方法,研究多水平(包括2个水平)的应变量与其影响因子间关系的回归分析。即用于分析某类事件发生概率与自变量之间依存关系的回归,即Logistic回归。 Logistic这个名称来源于它所采用的Logit变换,和英文单词Logistic的含义(后勤的)一点关系都没有,与逻辑就更不相干了。 自从传入国内以来,Logistic回归就一直采用英文写法,从没有使用过译名。 第二节 Logistic回归的参数估计及假设检验 引发的新特点 由于反应变量为二分类,所以误差项应当服从二项分布,而不是正态分布。 误差项的分布规律应当和所预测的反应变量相同 由于上述原因,最小二乘法也不再适用, 最大似然法的优越性和重要性一举凸现出来。 最大似然法(maximum likelihood,ML)的基本思想是先建立似然函数或对数似然函数,求似然函数或对数似然函数达到极大时参数的取值,称为参数的最大似然估计值。 计算方法来自于概率分布。 似然(L, likelihood):某种结局组合出现的概率,由于总体率不同L也不同,所以又被称为似然函数。 一般地,logistic回归模型系数的意义是: 二、假设检验和回归系数的区间估计 1.似然比检验(likelihood ratio test) ⑴检验整个模型是否有统计学意义,即检验所有的偏回归系数是否均为0。检验假设为 H0:β1=…= βm=0 H1 :β1,…,βm 不全为0 统计量 G=- [2lnL (-1,…,-m) ] --2lnL ’ 其中L是不包含m个自变量的模型的似然函数。 L’是包含所有自变量的模型似然函数,G反映的是后一个模型较前一个模型拟和优度提高的程度。 大样本, H0成立的条件下,G服从自由度为m的卡方检验。 ⑵分别检验各个自变量是否有意义,即单个总体回归系数是否为零。检验假设为 H0:βi=0 H1 :βi≠0 统计量 G=-2lnL-[-2lnL’ (i)] 其中L是扣除Xi的模型似然函数,L’是包含Xi的模型的似然函数。 大样本, H0成立的条件下,G服从自由度为1的卡方检验。 2.Wald检验 常用于回归系数的假设检验,检验假设为 H0:βi=0 H1 :βi≠0 统计量 第三节 Logistic回归分析的分类 按数据的类型: 非条件logistic回归分析(成组数据) 条件logistic回归分析(配对病例-对照数据) 按反应变量取值个数: 二值logistic回归分析 多值logistic回归分析 按自变量个数: 一元logistic回归分析 对应四格表资料卡方检验 多元logistic回归分析 条件logistic回归 研究中有N个配比组,每组中n个病例配m个对照者。这时,各个研究对象发生某事件的概率即为条件概率。 适用于 配比设计的病例-对照研究 精细分层设计的队列研究 条件Logistic回归 1:1条件Logistic回归及模型 在1:1配对设计的病例-对照研究中,若y=1表示得病,y=0表示未得病;A表示病例,B为对照,一对病例和对照中只有1人得病的条件下恰好是A得病的概率为: 第四节 Logist

文档评论(0)

75986597 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档