第五章自变量的选择.ppt

下载文档 降价啦

3
0
约1.36千字
约 74页
2017-02-15 发布于天津
举报
版权申诉
保障服务

第五章自变量的选择.ppt

1、本文档共74页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第五章自变量的选择

选项2 slentry=value; 对forward和stepwise方法规定变量选入回归模型里的显著性水平。对forward方法缺省值是0.50,对stepwise是0.15. slstay=value; 对backward和stepwise方法规定变量保留在模型里的显著性水平。对backward方法缺省值是0.10，对stepwise是0.15. 仅用于selection=adjrsq或cp的任选项 mse：平均残差平方和 aic：AIC信息量 bic: BIC信息量 jp：预测偏差的方差 sp：平均预测均方误差 PRESS方法可在selection=forward,backward,stepwise时在outest数据集中输出。例如： proc reg data=… outest=新数据集 press; model y=x1-x4/selection=stepwise; run; 例子5.1 (pp.124) data page124; input x1-x4 y; cards; 7 26 6 60 78.5 1 29 15 52 74.3 11 56 8 20 104.3 11 31 8 47 87.6 7 52 6 33 95.9 11 55 9 22 109.2 3 71 17 6 102.7 1 31 22 44 72.5 2 54 18 22 93.1 21 47 4 26 115.9 1 40 23 34 83.8 11 66 9 12 113.3 10 68 8 12 109.4 ; proc reg; model y=x1 x2 x3 x4/selection=stepwise; run; AIC准则 proc reg; model y=x1 x2 x3 x4/selection=cp aic; run; JP统计量准则 proc reg; model y=x1 x2 x3 x4/selection=cp jp; run; §5.3 自变量选择准则 §5.6 逐步回归的思想当可供选择的自变量太多时，当然可用前面所述的自变量选择的准则去选择好的方程，但很复杂，因此很不实用。为此需要找一些简便的方法找到较好的方程。 SAS中实现自变量的选择第五章自变量的选择 §5.1 引言在实际问题中可以提出许多可能对因变量有影响的自变量，如何从中选择确实有影响的自变量来建立回归方程是一个十分重要的问题。如果方程中包含的自变量过多，那么不仅使用不便，还可能削弱估计和预测的精度，而自变量过少或选得不恰当，又会使所建立的模型与实际有偏离而不能使用。然而，自变量的选择又是一个十分复杂的问题，而涉及的计算量都很大，本章的目的是对自变量选择作一些理论分析，提出一些变量选择准则，并介绍有关的计算方法。 §5.2 自变量选择的后果自变量的选择问题可以看成是这样二个问题：究竟应用全模型还是用选模型；若用选模型，则究竟应包含多少变量最适合。如果全模型为真，而我们用了选模型，这就表示在方程中丢掉了部分有用变量，相反，如果选模型为真，而我们选用了全模型，这就表示在方程中引入了一些无用变量，下面从参数估计和预测两个角度来看一看由于模型选择不当带来的后果。