SAS2005 Ch8 多元线性回归分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元线性回归分析 Multiple Linear Regression 前一章学习了完成直线相关与回归分析的两个过程CORR和REG,这一章我们将学习多元线性回归分析。 首先,介绍多元线性回归分析。其实,REG过程不仅可以完成只有一个自变量的直线回归分析,还可以完成多个自变量的多元线性回归分析。 作多元线性回归时REG过程的语法格式与简单直线回归的语法完全相同。所不同的是,在模型中等号右边包含多个自变量而不是一个。由于多元线性回归分析涉及的自变量有时比较多,在分析时一般要作自变量的筛选,因此,这里主要介绍涉及到变量筛选的选项。 一、Model语句中的常用选项 二、应用实例 例8-1 为了了解糖尿病病人收缩压(SBP)与年龄(AGE)、病程(COURSE)、BMI、空腹血糖(FBG) 、血清总胆固醇(TC)、血清甘油三酯(TG)、血清高密度脂蛋白-胆固醇(HDL-C)、血清低密度脂蛋白-胆固醇(LDL-C)等因素的关系,现收集了107名患者的资料。(部份资料如下所示)     请以收缩压(SBP)为应变量,其它为自变量建立多元线性回归方程。 建立SAS数据集 假设107名患者的资料已存储在文本文件c:\mydata\ex81.txt中。 调用REG过程进行分析 分析结果 结果解释 本例的回归模型检验:F=29.40,P.0001,模型有统计学意义。 采用逐步回归法,只纳入两个变量hdlc、BMI, 最后的回归方程为: sbp=168.09995+1.96698bmi-59.76947hdlc  由方程系数可以看出bmi的系数是正的,而hdlc的系数为负的,因此二者对血压的影响有相反的作用。从结果中还可以得出此模型的决定系数R2=0.3612,即二者对血压变异的解释达到36.12%,尚有63.88%的变异没有得到解释,提示可能存在还没有考查到的因素(前面考虑的因素之外)对血压起着影响作用。 SAS命令框:Help reg 回车 Slide * 彭斌    1、SELECTION=method   规定变量筛选的方法,method可以是以下几种选项:   1)FORWARD(或F),向前筛选法,按照SLE规定的入选显著性水平,选择偏回归平方和最大且在规定的水平上显著的自变量逐个引入方程,直到无变量引入为止。   2)BACKWARD(或B),向后剔除法,按照SLS规定的剔除显著性水平,从含有全部变量的模型开始,依次剔除一个变量,直到无变量剔除为止。   3)STEPWISE(或S),逐步法,按照SLE规定的入选显著性水平,依次选入变量,同时对模型中现有的变量按SLS规定的剔除显著性水平剔除不显著的变量,直到无变量引入且无变量剔除为止。   4)NONE,即不作任何变量筛选,此时回归模型中含有全部自变量。系统默认。   5)此外,还有其它的选择方法,如MAXR、 MINR、 RSQUARE、 ADJRSQ、 CP等。    2、INCLUDE=n   该选项强制前面n个自变量进入回归模型,无论它们是否显著。    3、SLE=值   规定变量入选模型的显著性水平,前进法的默认是0.5,逐步法是0.15。 4、SLS=值   规定变量保留在模型的显著水平,后退法默认为0.10,逐步法是0.15。 5、STB   STB产生标准化回归系数,可用来比较各个自变量作用的大小。 6、COLLIN   要求详细分析自变量之间的共线性,给出信息矩阵的特征根和条件数,来判断自变量之间有无多重共线性。 data ex81; infile c:\mydata\ex81.txt; input age course bmi sbp fbg tc tg hdlc ldlc; run; proc reg; model sbp=age course bmi fbg tc tg hdlc ldlc /selection=stepwise stb; run; quit; 这是选择逐步法(stepwise)对变量进行筛选。 Stb选项对回归系数进行标准化。 The REG Procedure Model: MODEL1 Dependent Variable: sbp Analysis of Variance Source DF Sum of Squares Mean Square F Value Pr??F Model 2 21649 10824 29.40 .0001 Error 104 38294 368.21187 Corrected Total 106 59943 Root MSE 19.18885 R-Square 0.3612 Dependent Mean 144.45794 Adj R-Sq 0.3489 Coeff

文档评论(0)

小教资源库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档