网站大量收购独家精品文档,联系QQ:2885784924

Logistic回归的参数估计.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Logistic回归的参数估计.ppt

Logistic 回归分析 (Logistic Regression Analysis) Logistic 回归分析 多重线性回归分析的前提条件 线性;独立;正态;等方差 医学中还常研究二分类因变量(如患病与未患病、阳性与阴性等)或多分类因变量与一组自变量(X1,X2,...Xm,)的关系,线性回归分析方法就无能为力。 Logistic 回归分析 Logistic 回归分析可解决: 应变量为: 二分类; 无序多分类; 有序多分类; 本次教学主要介绍应变量为二分类的Logistic 回归分析 Logistic 回归分析 按设计, Logistic 回归分析分为: 成组:非条件Logistic 回归分析 配对:条件Logistic 回归分析 Logistic回归模型 例 为探讨超重和肥胖对高血压病的影响,2004年,某研究者采用整群抽样的方法,对某地6个镇35周岁以上的常住人口进行高血压普查,同时收集了身高、体重等相关信息。整理后资料见下表。 目的:建立高血压患病率与体质指数间的数量关系模型,估计超重与肥胖对高血压患病的风险。 不同体质指数组高血压患病率 Logistic回归模型 因变量为二分类变量,不满足线性回归分析条件,首先对进行数据变换: 这个变换将取值在0-1间的值转换为值域在( )的值。 建立 与X的线性模型: 或 Logistic回归模型 求解 右端在数学上属于Logistic函数,所以称其为Logistic回归模型 。 Logistic回归模型 若自变量扩展到个P个,(X1,X2,...XP,),则多个自变量的回归模型为 模型参数的意义 Β0 :常数项(截距),表示模型中所有自变量均为0时, 的值; β1 , β2 、... βP:回归系数 ,表示在控制其他自变量时,自变量变化一个单位所引起的 改变量。 模型参数的意义 由于 模型参数的意义 例中 “超重或肥胖”组(X=1)患高血压的优势为: “正常”组(X=0)患高血压的优势为: 两组的优势比(odds ratio, OR) 为: 模型参数的意义 一般地,根据多个自变量的回归模型,在其他变量取值不变的情形下,与变量Xj的二个水平C1与C2(C2C1)相对应的事件的优势比为 : 当XJ的二个水平相差1个单位时, 模型参数的意义 Logistic回归分析广泛用于流行病学中前瞻性的队列研究、回顾性的病例-对照研究以及现况研究。 当变量Xj的回归系数Βj 0时, Xj增加1个单位后与增加前相比,事件的优势比ORj 1,表明Xj为危险因素; Βj 0时, Xj增加1个单位后与增加前相比,事件的优势比ORj 1 ,表明Xj 为保护因素; Βj =0 , Xj增加1个单位后与增加前相比,事件的优势比, ORj =1,表明Xj对结果变量不起作用。 Logistic回归的参数估计 Logistic回归模型中的参数β1 , β2 、… βP需要通过样本资料,按照一定方法进行估计,估计量记为b1 , b2 、… bP。 参数估计方法有多种,极大似然估计( MLE)最为常用 Logistic回归的参数估计 极大似然估计基本思想 选择能有最大概率获得当前样本的参数值作为参数的估计值。 Logistic回归的参数估计 假设n例观察对象彼此独立,其自变量为, 因变量为Yi(0-1变量), 。 对于第i个体,给定Xi时,出现观察结果Yi 的概率为: Logistic回归的参数估计 对于n个独立个体,给定自变量时,出现当前观察结果的概率为上述n个概率的乘积 Logistic回归的参数估计 上式为似然函数(likelihood function),记为L。求解β0 , β1 , β2 、… βP ,使似然函数达到极大,或使似然函数的对数达到极大,这样得到的解记为b1 , b1 , b2 、… bP ,称为参数 的极大似然估计值。 * 27.30 7953 2987 10940 合计 39.92 2492 1656 4148 超重或肥胖 X=1 19.60 5461 1331 6792 正常 X=0 患病率(%) 未患病 Y=0 患病 Y=1 调查人数 体质指数X *

文档评论(0)

ailuojue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档