- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元线性回归
多元线性回归;多元线性回归;内容安排;多元线性回归模型与参数估计;参数的最小二乘估计;回归方程和偏回归系数的假设检验;偏回归系数的假设检验
回归方程的假设检验若拒绝H0,则可分别对每一个偏回归系数bj作统计检验,实质是考察在固定其它变量后,该变量对应变量 Y 的影响有无显著性。
H0: Bj=0
H1: Bj不为零 ?=0.05
F = (Xj 的偏回归平方和/1) / MS误差
Xj 的偏回归平方和:去Xj后回归平方和的减少量
若H0成立,可把Xj从回归方程中剔除,余下变量重新构建新的方程。
;标准化偏回归系数和确定系数;确定系数:
简记为R2,即回归平方和SS回归与总离均差平方和SS总的比例。
R2 = SS回归/ SS总
可用来定量评价在Y的总变异中,由P个X变量建立的线性回归方程所能解释的比例。
;回归分析中的若干问题;如职业,分四类可用三个伪变量:
y1 y2 y3
工人 1 0 0
农民 0 1 0
干部 0 0 1
学生 0 0 0;多元线性回归方程的评价
评价回归方程的优劣、好坏可用确定系数R2和剩余标准差Sy,x1,2..p 。
Sy,x1,2. p =SQRT(SS误差/n-p-1)
如用于预测,重要的是组外回代结果。
;回归方程中自变量的选择;选择变量的统计学标准;选择变量的方法;向前引入法(forward selection)
自变量由少到多一个一个引入回归方程。将 corr(y , xj)最大而又能拒绝H0者,最先引入方程,余此类推。至不能再拒绝H0为止。
;向后剔除法(backward selection)
自变量先全部选入方程,每次剔除一个使上述检验最不能拒绝H0者,直到不能剔除为止。
;逐步引入-剔除法(stepwise selection)
先规定两个阀值F引入和F剔除,当候选变量中最大F值>=F引入时,引入相应变量;已进入方程的变量最小F<=F剔除时,剔除相应变量。如此交替进行直到无引入和无剔除为止。(计算复杂)
;多元线性回归方程的作用;例:测量16名四岁男孩心脏纵径X1(CM)、心脏横径X2(CM)和心象面积Y(CM2)三项指标,得如下数据。试作象面积Y对心脏纵径X1、心脏横径X2多元线性回归分析。
例:某科研协作组调查山西某煤矿2期高血压病患者40例,资料如下表,试进行影响煤矿工人2期高血压病病人收缩压的多元线性回归分析。;Logistic回归; 多元回归分析可用来分析多个自变量与一个因变量的关系,模型中因变量Y是边连续性随机变量,并要求呈正态分布。但在医学研究中,常碰到因变量的取值仅有两个,如药物实验中,动物出现死亡或生存,死亡概率与药物剂量有关。设P表示死亡概率,X表示药物剂量,P和X的关系显然不能用一般线性回归模型P=B0+B1X来表示。这时可用Logistic回归分析。;内容安排;Logistic回归模型; 以因变量D=1表示死亡,D=0表示生存,以P(D=1/X)表示暴露于药物剂量X的动物死亡的概率,设
P(D=1/X)=e Bo+BX /(1+e Bo+BX )
记Logit(P)=ln[p/(1-p)],则上式可表示为:
Logit(P) = Bo+BX
这里X的取值仍是任意的, Logit(P)的值亦在正负无穷大之间,概率P的数值则必然在0-1之间。 p/(1-p)为事件的优势, Logit(P)为对数优势,故logistic回归又称对数优势线性回归
; 一般地,设某事件D发生(D=1)的概率P依赖于多个自变量(x1,x2, …,xp),且
P(D=1)=e Bo+B1X1+…+BpXp /(1+e Bo+B1X1+…+BpXp )
或
Logit(P) = Bo+B1X1+…+Bp X p
则称该事件发生的概率与变量间关系符合多元Logistic回归或对数优势线性回归。
; logistic回归模型参数的意义;Logistic回归的参数估计;Logistic回归的假设检验;2、偏回归系数的显著性检验:目的是检验回归模型中自变量的系数是否为零,等价于总体优势比OR是否为零。
H0:B等于零
文档评论(0)