- 1、本文档共36页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Logistic回归
第21页,共36页,星期六,2024年,5月多元回归分析可用来分析多个自变量与一个因变量的关系,模型中因变量Y是边连续性随机变量,并要求呈正态分布。但在医学研究中,常碰到因变量的取值仅有两个,如药物实验中,动物出现死亡或生存,死亡概率与药物剂量有关。设P表示死亡概率,X表示药物剂量,P和X的关系显然不能用一般线性回归模型P=B0+B1X来表示。这时可用Logistic回归分析。第22页,共36页,星期六,2024年,5月内容安排Logistic回归模型模型参数的意义Logistic回归模型的参数估计Logistic回归方程的假设检验Logistic回归模型中自变量的筛选Logistic回归的应用第23页,共36页,星期六,2024年,5月Logistic回归模型先引入Logistic分布函数,表达式为:F(x)=ex/(1+ex)X的取值在正负无穷大之间;F(x)则在0-1之间取值,并呈单调上升S型曲线。人们正是利用Logistic分布函数这一特征,将其应用到临床医学和流行病学中来描述事件发生的概率。第24页,共36页,星期六,2024年,5月以因变量D=1表示死亡,D=0表示生存,以P(D=1/X)表示暴露于药物剂量X的动物死亡的概率,设P(D=1/X)=eBo+BX/(1+eBo+BX)记Logit(P)=ln[p/(1-p)],则上式可表示为:Logit(P)=Bo+BX这里X的取值仍是任意的,Logit(P)的值亦在正负无穷大之间,概率P的数值则必然在0-1之间。p/(1-p)为事件的优势,Logit(P)为对数优势,故logistic回归又称对数优势线性回归第25页,共36页,星期六,2024年,5月一般地,设某事件D发生(D=1)的概率P依赖于多个自变量(x1,x2,…,xp),且P(D=1)=eBo+B1X1+…+BpXp/(1+eBo+B1X1+…+BpXp)或Logit(P)=Bo+B1X1+…+BpXp则称该事件发生的概率与变量间关系符合多元Logistic回归或对数优势线性回归。第26页,共36页,星期六,2024年,5月logistic回归模型参数的意义优势比(oddsratio,OR):暴露人群发病优势与非暴露人群发病优势之比。P(1)/[1-p(1)]OR=———————P(0)/[1-p(0)]Ln(oR)=logit[p(1)]-logit[p(0)]=(B0+B×1)-(B0+B×0)=B可见B是暴露剂量增加一个单位所引起的对数优势的增量,或单位暴露剂量与零剂量死亡优势比的对数。eB就是两剂量死亡优势比。常数项B0是所有变量X等于零时事件发生优势的对数。第27页,共36页,星期六,2024年,5月Logistic回归的参数估计Logistic回归模型的参数估计常用最大似然法,最大似然法的基本思想是先建立似然函数或对数似然函数,似然函数或对数似然函数达到极大时参数的取值,即为参数的最大似然估计值。其步骤为对对数似然函数中的待估参数分别求一阶偏导数,令其为0得一方程组,然后求解。由于似然函数的偏导数为非线性函数,参数估计需用非线性方程组的数值法求解。常用的数值法为Newton-Raphson法。不同研究的设计方案不同,其似然函数的构造略有差别,故Logistic回归有非条件Logistic回归与条件Logistic回归两种。第28页,共36页,星期六,2024年,5月Logistic回归的假设检验1、拟合优度检验:目的是检验模型估计值与实际观察值的符合程度。SAS程序提供了下列统计量。A、AIC和SC:对同一份资料,在模型比较中,这两个越小,表明模型越合适。B、-2LogL:用于检验全部自变量(协变量)的联合作用。如显著,表明全部协变量的联合作用显著;如不显著,表明全部协变量的联合作用不大,可予忽视。C、Score:用于检验全部协变量联合作用的显著性,但不包截距项。第29页,共36页,星期六,2024年,5月2、偏回归系数的显著性检验:目的是检验回归模型中自变量的系数是否为零,等价于总体优势比OR是否为零。H0:B等于零H1:B不等于零A、wald检验:B、Scoretest:C、likelih
文档评论(0)