网站大量收购闲置独家精品文档,联系QQ:2885784924

Logistic回归分析知识讲稿.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Logistic回归分析知识讲稿.ppt

* Logistic 回归分析 Logistic Regression Analysis 翟景花 公共卫生学院 医学研究者经常关心的问题诸如: 吸烟是否影响肺癌的发病? 年龄和糖尿病的发病有无关系? 哪些因素导致了手术后有的人感染,而有的人不感染? 哪些因素导致了某种治疗方法出现治愈、显效、好转、无效等不同的效果? 是回归分析问题吗? 这些应该是属于回归分析问题! 但是这种回归分析问题不能借助于线性回归模型,因为反应变量的假设条件遭到破坏 能否找到一种其他形式的模型y=f(x)来描述分类变量y和x之间依存关系呢? NO 因为从数学角度看,使得x取任意值而y仅 取1和0两个值的函数不存在。 YES! “转换一个角度来解决这个问题” y=f(x) p=p(y=1|x)=p(x) 不能直接分析 变量y与x的关系 转换为分析 y取某个值的概率 变量p与x的关系 y=1,0 x任意 0≤p≤1, x任意 存在 Logistic回归模型 不存在 主要内容 Logistic 回归模型的基本概念 Logistic回归的参数估计及假设检验 Logistic回归分析的分类 Logistic回归的应用 第一节 Logistic 回归模型的基本概念 一、 Logistic 回归的实例 二、 Logistic 回归模型的基本结构 AMI抢救后死亡率与影响因素关系的回归模型 P值大于1或小于0 变量变换 1970年,Cox引入了Logit变换 请注意其右侧仍然可以写成线性的形式! 大量实践证明,LogitP往往和自变量呈线性关系。 已经成为了分类变量的标准建模方法。 Logistic 函数 Logistic 回归模型 多变量的Logistic回归模型 Logistic 回归概念 是分类数据统计分析的一种重要方法,研究多水平(包括2个水平)的应变量与其影响因子间关系的回归分析。即用于分析某类事件发生概率与自变量之间依存关系的回归,即Logistic回归。 Logistic这个名称来源于它所采用的Logit变换,和英文单词Logistic的含义(后勤的)一点关系都没有,与逻辑就更不相干了。 自从传入国内以来,Logistic回归就一直采用英文写法,从没有使用过译名。 第二节 Logistic回归的参数估计及假设检验 引发的新特点 由于反应变量为二分类,所以误差项应当服从二项分布,而不是正态分布。 误差项的分布规律应当和所预测的反应变量相同 由于上述原因,最小二乘法也不再适用, 最大似然法的优越性和重要性一举凸现出来。 最大似然法(maximum likelihood,ML)的基本思想是先建立似然函数或对数似然函数,求似然函数或对数似然函数达到极大时参数的取值,称为参数的最大似然估计值。 计算方法来自于概率分布。 似然(L, likelihood):某种结局组合出现的概率,由于总体率不同L也不同,所以又被称为似然函数。 一、Logistic回归的参数估计及意义 常数项表示在自变量取值均为0时,死亡优势(比数)的自然对数值。 exp( )=0.124是无休克、无心衰和抢救及时组死亡的优势。 当死亡率很低时,该值近似等于自然死亡率。 β为Logistic回归系数,表示其它自变量取值固定时,该自变量增加一个单位引起优势比自然对数的变化量。β=lnOR, OR=eβ或OR=exp(β) OR表示暴露组的疾病危险是非暴露组的多少倍。 OR1为危险因素;OR1为保护因素。 logistic回归模型系数β的意义解释: 从 e? =OR≈RR,说明当发病率很低时,e?近似地表示了相对危险度,即暴露下的发病率与非暴露下的发病率之比。 例如,在例20-1中得到? 1=1.110, 因此,RR ≈OR= e? =3.034, 表明心梗发生后抢救前有休克的死亡危险是没有休克的3.034 倍。 一般地,logistic回归模型系数的意义是: 2)如果X是连续变量,则OR近似表示在X相邻两个单位上的相对危险度。 1)如果X=1、0,则OR近似表示在X=1条件下的发病率与X=0条件下发病率之比。(见例20-1) 3)如果X是分类变量,则要将X的哑变量放入模型,则OR表示两个类之间的相对危险度。 二、假设检验和回归系数的区间估计 1.似然比检验(likelihood ratio test) ⑴检验整个模型是否有统计学意义,即检验所有的偏回归系数是否均为0。检验假设为 H0:β1=…= βm=0 H1 :β1,…,βm 不全为0 统计量 G=- [2lnL (-1,…,-m) ] --2lnL ’ 其中L是不包含m个自变量的

您可能关注的文档

文档评论(0)

yuzongxu123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档