- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学统计:多元线性回归
多元线性回归分析 multiple regression Review of basic regression concepts Review of basic regression concepts Review of basic regression concepts Review of basic regression concepts Review of basic regression concepts Review of basic regression concepts 多元回归分析数据格式 多元线性回归 (一)多元线性回归模型 (二)多元线性回归分析的一般步骤 二、多元线性回归方程的建立 各变量的离差矩阵 各变量的离差矩阵 建立多元回归方程 三、多元线性回归方程的假设检验 (一)回归方程的假设检验--方差分析 SS总=lyy=222.5519;ν总=n-1=26 SS回归=b1l1y+ b2l2y + b3l3y + b4l4y =0.1424×67.6962+0.3515×89.8025 +0.2706×142.4347+0.6382×84.5570 =133.7107; ν回归=m=4 SS剩余=222.5519-133.7107=88.8412 ν剩余=n-m-1=22 方差分析结果: (二)偏回归系数的假设检验 各回归系数的t 检验: 三、回归效果的评价 评价回归方程回归效果的优劣是回归分析的重要内容之一。常用评价指标有: 复相关系数、 决定系数、 校正决定系数、 剩余标准差等。 1.复相关系数 复相关系数(R),衡量因变量Y与回归方程内所有自变量线性组合件相关关系的密切程度。 0=R=1,没有负值。 R的值越接近1,说明相关关系越密切;越接近0说明相关关系越弱。 第二节 逐步回归分析 1.最优子集回归法 最优子集法的局限性 二、逐步选择法 (一)前进法 (二)后退法 (三)逐步回归法 二、逐步回归分析 第三节 多元线性回归的应用及其注意事项 二、 多元线性回归应用时的注意事项 1.样本含量 2.方程“最优”问题 3.关于逐步回归 4.多元共线性 5. 异常值识别与强影响分析 多元共线性的表现在实际应用中主要表现为: (1)模型拟合效果很好,但偏回归系数几乎都无统计学意义; (2)偏回归系数估计值的方差很大; (3)偏回归系数估计值不稳定,随着样本含量的增减各偏回归系数发生较大变化或当一个自变量被引入或剔除时其余变量偏回归系数有很大变化; (4)偏回归系数估计值的大小与符号可能与事先期望的不一致或与经验相悖,结果难以解释 出现以上表现,提示存在多元共线性问题,应进行多元共线性诊断。 注意 0.39774 0.6382 X4 -0.33948 -0.27059 X3 0.30931 0.35147 X2 0.07758 0.14245 X1 标准化偏回归系数b’j 回归系数bj 变量 偏回归系数 偏回归系数标准误 标准偏回归系数 剩余标准差 决定系数R2 校正决定系数R2adj 因变量的y变异系数 CV=(ROOT MSE/DEP MEAN)×100 因变量的y均值 求出所有自变量可能组合子集的回归方程的模型(共有2m-1个),按一定准则选择最优模型,常用的准则有: ①校正决定系数(考虑了自变量的个数) ②Cp准则(C即criterion,p为所选模型中变量 的个数;Cp接近(p+1)模型为最优) ③AIC(Akaike`s Information Criterion)准则;AIC 越小越好 如果自变量个数为4,则所有的回归有24-1=15个;当自变量数个数为10时,所有可能的回归为 210-1= 1023个;……..;当自变量数个数为50时,所有可能的回归为250-1≈1015个。 1. 前进法(forward selection) 2. 后退法(backward elimination) 3. 逐步回归法(stepwise regression)。 它们的共同特点是每一步只引入或剔除一个自变量。决定其取舍则基于对偏回归平方和的F检验 自变量从无到有、从少到多 Y对每一个自变量作直线回归,对回归平方和最大的自变量作F 检验,有意义(P小)则引入。 在此基础上,计算其它自变量的偏回归平方和,选取偏回归平方和最大者作F 检验,…。 局
文档评论(0)