- 1、本文档共56页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
18 Logistic 回归.ppt
生物医学研究的统计方法 第18章 Logistic Regression Analysis 前 言 线性回归模型:因变量是连续且服从正态分布的变量,自变量和因变量呈线性关系。 logistic回归模型:因变量是分类变量,且自变量与因变量没有线性关系。 logistic回归模型非常巧妙地避开了分类变量的分布问题,补充完善了线性回归模型的缺陷。 【学习目标】 ① 了解logistic回归模型的基本结构。 ② 掌握logistic回归分析的用途;logistic回归系数的意义及其与优势比或相对危险度的关系。 主要内容 Logistic回归模型的基本原理 Logistic回归模型的数学函数 Logistic回归模型拟合实例 Logistic回归模型的用途和注意事项 【基本原理 】 二分类变量(Y):生存与死亡、有病与无病、有效与无效、感染与未感染等。 多分类变量(Y):疾病程度(轻度、中度、重度)、治疗效果(治疗、显效、好转、无效)等。 实际问题:哪些因素(X)导致了人群中有些人患某种病(Y)?哪些因素(X)导致了某种治疗方法出现治愈、显效、好转、无效等不同的效果(Y)? 根据反应变量(分类变量)类型的不同,logistic回归模型可分为: 【基本原理】 问题实质:建立函数y=f(x)能够用来近似地描述x和y之间关系! 困难:很难找到一个函数y=f(x),当x变化时,它对应的函数值y仅取两个或几个有限值。 新思路:不直接分析y与x的关系,分析y取某个值的概率p与x的关系。p=p(x),使得当x变化时,它对应的函数值p不超出[0,1]范围。 方法: logistic回归模型就是满足这种要求的函数之一 。 【基本原理】 logistic回归分析的基本原理就是利用一组观测数据拟合一个logistic模型,然后借助于这个模型来提示总体中若干个自变量与一个因变量取每个值的概率之间的依存关系,并评估用这一模型拟相关事物变化规律的准确性。具体地说,logistic回归分析可以从统计意义上确定在消除了其它自变量的影响后,每一个自变量的变化是否引起因变量取某个值的概率的变化,并且估计出在其它自变量固定不变的情况下,每个自变量对因变量取某个值的概率的数值影响的大小。 【 Logistic回归模型的数学函数】 若因变量y为连续型数值变量时,可采用多元线性重回归分析y与变量 X1, X2, … , Xp之间的关系: 等式左边 变化范围 经数学变换可得: 表示在不接触任何潜在危险/保护因素条件下,即在自变量均为零时效应事件发生(死亡)优势(odds)的对数值,或效应指标发生与不发生的概率之比的对数值。 为因素Xi的Logistic回归系数,exp( )为其他各因素取固定值时,因素Xi与疾病关联的优势比( OR ),反映了危险因素Xi与疾病关联的程度。或称为其某两个相邻水平相比对效应事件发生的优势比的对数值。 【实例拟合】 例18-1 非甾体抗炎药上市前的研究中,已知可能引起亚临床上消化道出血症状。因此,1980年Strom和Carson开展了大样本上市后安全性再评价,以确定该药品是否能引起上消化道出血不良反应。回顾性跟踪调查的47136例服用该药的患者中,有155例上消化道出血;同期没有服用该药的44634例对照中,有96例上消化道出血。 案例解析 研究目的:分析上消化道出血症状与非甾体抗炎药的关系。 反应变量类型:二分类 资料收集方式:病例和对照不匹配 分析方法:非条件二项 Logistic 回归模型。 Logistic回归分析的基本步骤 (一)回归系数的估计 (最大似然法) (二)Logistic回归模型的假设检验 (似然比检验; waldχ2检验) (三)回归系数假设检验和区间估计 ( waldχ2检验) 最大似然法(Maximum likelihood estimate, ML)的基本思想是先建立似然函数或对数似然函数,求似然函数或对数似然函数达到极大时参数的取值,称为参数的最大似然估计值。 通过比较包含与不包含某一个或几个待检验观察因素的两个模型的对数似然函数变化来进行,其统计量为G (又称Deviance)。 Logistic回归模型的假设检验 似然比检验(likelihood Ratio) 得分检验(Score) Wald ?2检验 回归系数的假设检验和区间估计 通过比较包含与不包含某一个或几个待检验观察因素的两个模型的对数似然函数变化来进
文档评论(0)