第五章-2014.ppt

第五章-2014

内容安排 内容安排 应用回归分析 (Applied Regression Analysis) 第五章 自变量的选择与逐步回归 第五章 自变量的选择与逐步回归 §5.1 自变量选择对估计和预测的影响 §5.2 所有子集回归 §5.3 逐步回归 §5.4 本章小结与评注 20.5 113.0 114.0 189.0 18 19.9 112.3 113.0 185.0 17 19.5 112.0 112.5 174.0 16 18.5 111.0 112.0 170.0 15 15.9 109.5 109.0 161.0 14 14.9 105.9 106.0 153.0 13 14.2 104.0 105.0 148.0 12 13.5 102.5 102.0 131.2 11 12.3 101.2 101.5 126.4 10 11.3 98.0 98.9 117.7 9 10.9 97.0 95.6 105.3 8 10.6 97.5 95.0 102.0 7 10.3 97.0 96.0 99.9 6 9.6 96.0 93.0 88.0 5 9.0 95.5 92.9 85.9 4 8.7 95.0 91.5 83.2 3 8.4 94.0 92.0 82.9 2 7.8 87.0 85.0 81.2 1 (百万元) x3(%) x2(%) x1(元) 序号 表5.1 某消费品销售额及影响因素数据 这个例子中,n=18,m=3, 所有的自变量子集有2m-1=7个,即有7个回归子集。 2.000 37.52 0.9771 0.9811 x1,x2,x3 17.461 50.09 0.9519 0.9576 x2,x3 2.005 37.93 0.9755 0.9784 x1,x3 4.734 40.76 0.9714 0.9747 x1,x2 20.452 50.74 0.9477 0.9508 x3 16.151 48.48 0.9539 0.9566 x2 4.134 40.06 0.9711 0.9728 x1 Cp AIC R2 自变量子集 表 5.2 由表5.2的3项指标均可看到x1,x2,x3是“最优”子集,x1,x3是“次优”子集。回归方程分别为 三、用SAS软件寻找最优子集 SAS软件共有三个基本窗口,分别为: (1)程序编辑窗(PROGRAM EDITOR),用来编辑程序。 (2)日志窗(LOG),显示已执行的语句和系统信息,包括 错误信息。 (3)输出窗(OUTPUT)显示程序运行结果。 用主菜单的Window命令可以实现在三个窗口间的转换。 data data1; input x1-x12 y; cards; 1.94 4.5 154.45 207.33 246.87 277.64 135.79 30.58 110.67 80.83 51.83 14.09 2384 0.33 6.49 133.16 127.29 120.17 114.88 81.21 14.05 35.7 16 27.1 2.93 202 … ; proc reg; model y=x1-x12/selection=adjrsq; run; 以下是部分输出结果: Adjusted R-square Variables in Model R-square In 0 0 6 X3 X5 X8 X9 X10 X11 0 0 7 X3 X5 X6 X8 X9 X10 X11 0 0 6 X3 X6 X8 X9 X10 X11 0 0 7 X3 X4 X5 X8 X9 X10 X11 0 0 7 X3 X5 X8 X9 X10 X11 X12 0 0 7 X3 X5 X7 X8 X9 X10 X11 … 一、问题的提出及逐步回归的思想 自变量的所有可能子集构成2m-1个回归方程,当可供选择的自变量不太多时,用前边的方法可以求出一切可能的回归方程,然后用几个选元准则去挑出“最好”的方程,但是当自变量的个数较多时,要求出所有可能的回归方程是非常困难的。为此,人们提出了一些较为简便、实用、快速

文档评论(0)

1亿VIP精品文档

相关文档