- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
十多元线性回归与logistic回归
第十一章 多元线性回归与logistic回归
一、教学大纲要求
(一)掌握内容
1.多元线性回归分析的概念:多元线性回归、偏回归系数、残差。
2.多元线性回归的分析步骤:多元线性回归中偏回归系数及常数项的求法、多元线性回归的应用。
3.多元线性回归分析中的假设检验:建立假设、计算检验统计量、确定值下结论。
4.logistic回归模型结构:模型结构、发病概率比数、比数比。
5.logistic回归参数估计方法。
6.logistic回归筛选自变量:似然比检验统计量的计算公式;筛选自变量的方法。
(二)熟悉内容
常用统计软件(SPSS及SAS)多元线性回归分析方法:数据准备、操作步骤与结果输出。
(三)了解内容
标准化偏回归系数的解释意义。
二、教学内容精要
(一) 多元线性回归分析的概念
将直线回归分析方法加以推广,用回归方程定量地刻画一个应变量与多个自变量X间的线形依存关系,称为多元线形回归(multiple linear regression),简称多元回归(multiple regression)
基本形式:
式中为各自变量取某定值条件下应变量均数的估计值,,,…,为自变量,为自变量个数,为回归方程常数项,也称为截距,其意义同直线回归,,,…, 称为偏回归系数(partial regression coefficient),表示在除以外的自变量固定条件下,每改变一个单位后的平均改变量。
(二) 多元线性回归的分析步骤
是与一组自变量,,…,相对应的变量的平均估计值。
多元回归方程中的回归系数,,…, 可用最小二乘法求得,也就是求出能使估计值和实际观察值的残差平方和为最小值的一组回归系数,,…, 值。根据以上要求,用数学方法可以得出求回归系数,,…, 的下列正规方程组(normal equation):
式中
?
常数项可用下式求出:
(三)多元线性回归分析中的假设检验
在算得各回归系数并建立回归方程后,还应对此多元回归方程作假设检验,判断自变量,,…,是否与真有线性依存关系,也就是检验无效假设(), 备选假设为各值不全等于0或全不等于0。
检验时常用统计量
式中为个体数,为自变量的个数。
式中
(四) logistic回归模型结构
设为一组自变量,为应变量。当是阳性反应时,记为=1;当是阴性反应时,记为=0。用表示发生阳性反应的概率;用表示发生阴性反应的概率,显然+=1。
Logistic回归模型为:
同时可以写成:
式中是常数项;是与研究因素有关的参数,称为偏回归系数。
事件发生的概率与之间呈曲线关系,当在之间变化时, 或在(0,1)之间变化。
若有例观察对象,第名观察对象在自变量作用下的应变量为,阳性反应记为=1,否则=0。相应地用表示其发生阳性反应的概率;用表示其发生阴性反应的概率,仍然有+=1。和的计算如下:
这样,第个观察对象的发病概率比数(odds)为,第个观察对象的发病概率比数为,而这两个观察对象的发病概率比数之比值便称为比数比(odds ratio)。对比数比取自然对数得到关系式:
ln
等式左边是比数比的自然对数,等式右边的是同一因素的不同暴露水平与之差。的流行病学意义是在其它自变量固定不变的情况下,自变量的暴露水平每改变一个测量单位时所引起的比数比的自然对数改变量。或者说,在其他自变量固定不变的情况下,当自变量的水平每增加一个测量单位时所引起的比数比为增加前的倍。同多元线性回归一样,在比较暴露因素对反应变量相对贡献的大小时,由于各自变量的取值单位不同,也不能用偏回归系数的大小作比较,而须用标准化偏回归系数来做比较。标准化偏回归系数值的大小,直接反映了其相应的暴露因素对应变量的相对贡献的大小。标准化偏回归系数的计算,可利用有关统计软件在计算机上解决。
(五)logistic回归参数估计
由于logistic回归是一种概率模型,通常用最大似然估计法(maximum likelihood estimate)求解模型中参数的估计值。
为在作用下的阳性事件(或疾病)发生的指示变量。其赋值为:
第个观察对象对似然函数的贡献量为:
当各事件是独立发生时,则个观察对象所构成的似然函数是每个观察对象的似然函数贡献量的乘积,即
式中∏为从1到的连乘积。
依最大似然估计法的原理,使得达到最大时的参数值即为所求的参数估计值,计算时通常是
文档评论(0)