多元线性回归分析——医学统计学课件.pptVIP

多元线性回归分析——医学统计学课件.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元线性回归分析——医学统计学课件

example2: (3)通过误差诊断判断上述模型是否可靠 proc reg data=a; model y=x1 x3 x5/ p r ; output out=b p=p r=r ; plot r.*p. ; run; proc univariate normal data=b; var r; run; ? 由univariate 输出可以看到,残差的均值为0且服从正态分布。 ? 由上述分析可知,回归模型的残差检验合乎要求,从而可以得到如下专业结论。 example2: (4)专业结论: 吸氧效率(y)与年龄(x1)、跑1.5km所用时间(x3)及跑步时心跳次数(X5)的线性回归模型: Y=113.005-0.2689x1-2.8233x3-0.1349x5 ① 在跑1.5km所用时间(x3)及跑步时心跳次数(X5)相同的条件下,年龄每增加1岁,吸氧效率将减少0.2689个单位; ② 在年龄(x1)和跑1.5km所用时间(x3)相同的条件下,跑步时心跳次数(X5) 每增加一个单位,吸氧效率将减少2.8233个单位; ③ 在年龄(x1)和跑步时心跳次数(X5)相同的条件下,跑1.5km所用时间(x3)每增加1分钟,吸氧效率将减少0.1349个单位; ④ 体重对吸氧效率的影响无统计学意义; ⑤ 跑步时最大心率和跑步时心率很相似,二者具有共线性,在研究吸氧效率时可以不考虑跑步时最大心率这个指标。 * Multivariate linear regression model Diagnostics ?诊断的目的是评价回归模型是否满足其假定条件,诊断内容包括: (1)自变量之间是否存在多重共线性; (2)残差的均值是否为零且方差为常数; (3)残差之间是否相互独立; (4)残差是否服从正态分布; (5)异常值识别。 例题14.3 非线性的例子 例题14.3 直接拟合x1和x2与y的线性模型: 例题14.3 X1、x2与y的图形 * * 标准化偏回归系数 y=0.35409x2-0.36013x3+0.41334x4 多元线性回归的应用及其注意事项 二、多元线性回归应用时的注意事项 1.样本含量 2.方程“最优”问题 3.关于逐步回归 4.多元共线性 5. 异常值识别与强影响分析 进行变量筛选去掉截距与保留截距时方程的决定系数与校正决定系数 4.残差分析 model y=x1-x4/selection=stepwise r; output out=bb Residual=z; run; proc cc; set bb; proc univariate normal; var z; run; 正态性检验 检验方法 ----统计量---- -------P 值------- Shapiro-Wilk W 0.968787 Pr W 0.5701 Kolmogorov-Smirnov D 0.148154 Pr D 0.1300 Cramer-von Mises W-Sq 0.070919 Pr W-Sq 0.2500 Anderson-Darling A-Sq 0.372642 Pr A-Sq 0.2500 从散点图可以看出,各点子分布无明显规律性,可认为近似随机分布,所以拟合的方程可认为是合适的。 多元共线性是指在进行多元回归分析时,自变量间存在较强的线性相关关系。共线关系的存在,可使得估计系数方差加大,系数估计不稳,结果分析困难。因此在多元回归分析时,特别是当回归结果难以用专业知识解释时,要进行共线性诊断,找出存在共线性且不重要的那些自变量,剔出方程,另行回归分析。 对于存在共线性的资料,可以利用共线性诊断有选择的保留自变量以消除共线性;或者采用岭回归、主成分回归等回归分析方法以避免共线性指标对结果的影响。 5.多元共线性 多元共线性问题产生的根源: 1、由变量性质引起 多元统计分析时,作为自变量的某些变量高度相关,比如身高、体重和胸围,变量之间的相关性是由变量自身的性质决定的,此时不论数据以什么形式取得,样本含量是大是小,都会出现自变量的共线性问题。因此,变量间自身的性质是导致多元共线性的重要原因。 多元共线性问题产生的根源: 2、由数据问题引起:样本含量过小、强影响观测值等 样本含量过小:假设只有两个自变量X1与X2,当n=2时,两点总能连成一条直线,即使性质上原本并不存在线性关系的变量X1与X2,由于样

文档评论(0)

ligennv1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档