自变量选择与逐步回归.pptVIP

  • 0
  • 0
  • 约2.13万字
  • 约 128页
  • 2026-01-08 发布于江西
  • 举报

2026/1/4中国人民大学六西格玛质量管理研究中心1第7章自变量选择与逐步回归§7.1自变量选择对估计和预测的影响§7.2所有子集回归§7.3逐步回归§7.4实例与评注目录上页下页返回结束

2026/1/4中国人民大学六西格玛质量管理研究中心2第7章自变量选择与逐步回归在建立一个实际问题的回归模型时,首先碰到的问题便是如何确定回归自变量,一般情况,大都是根据所研究问题的目的,结合实际问题理论罗列出对因变量可能有影响的一些因素作为自变量。如果遗漏了某些重要的变量,回归方程的效果肯定不会好;如果担心遗漏了重要的变量,而考虑过多的自变量,在这些变量中,某些自变量对问题的研究可能并不重要,有些自变量数据的质量可能很差,有些变量可能和其他变量有很大程度的重叠。如果回归模型把这样一些变量都选进来,不仅计算量增大好多,而且得到的回归方程稳定性也很差,直接影响到回归方程的应用。目录上页下页返回结束

2026/1/4中国人民大学六西格玛质量管理研究中心3第7章自变量选择与逐步回归从20世纪60年代开始,关于回归自变量的选择成为统计学中研究的热点问题。统计学家们提出了许多回归选元的准则,并提出了许多行之有效的选元方法。本章从回归选元对回归参数估计和预测的影响开始,介绍自变量选择常用的几个准则;扼要介绍所有子集回归选元的几个方法;详细讨论逐步回归方法及其应用。目录上页下页返回结束

2026/1/4中国人民大学六西格玛质量管理研究中心4§7.1自变量选择对估计和预测的影响一、全模型和选模型目录上页下页返回结束

2026/1/4中国人民大学六西格玛质量管理研究中心5§7.1自变量选择对估计和预测的影响目录上页下页返回结束

2026/1/4中国人民大学六西格玛质量管理研究中心6§7.1自变量选择对估计和预测的影响自变量的选择我们可以看成是对一个实际问题是用(7.1)式全模型还是用(7.2)式选模型去描述。如果应该用(7.1)式全模型去描述实际问题,而我们误选了(7.2)式选模型,这就说明我们在建模时丢掉了一些有用的变量;如果应该选用(7.2)式选模型,而我们误选了模型(7.1)式,这就说明我们把一些不必要的自变量引进了模型。模型选择不当会给参数估计和预测带来什么影响?下面我们将分别给予讨论。目录上页下页返回结束

2026/1/4中国人民大学六西格玛质量管理研究中心7§7.1自变量选择对估计和预测的影响二、自变量选择对预测的影响关于自变量选择对预测的影响可以分成两种情况考虑,第一种情况是全模型(7.1)式正确而误用了选模型(7.2)式;第二种情况是选模型(7.2)式正确而误用了全模型(7.1)式。以下分别考虑这两种情况对回归的影响。目录上页下页返回结束

2026/1/4中国人民大学六西格玛质量管理研究中心10§7.1自变量选择对估计和预测的影响性质1和性质2表明,当全模型(9.1)式正确时,而我们舍去了m-p个自变量,用剩下的p个自变量去建立选模型(9.2)式,参数估计值是全模型相应参数的有偏估计,用其作预测,预测值也是有偏的。这是误用选模型产生的弊端。目录上页下页返回结束

2026/1/4中国人民大学六西格玛质量管理研究中心11§7.1自变量选择对估计和预测的影响性质3和性质4表明,用选模型去作预测,残差的方差比用全模型去作预测的方差小,尽管用选模型所作的预测是有偏的,但得到的预测偏差的方差下降了。这说明尽管全模型正确,误用选模型是有弊也有利的。性质5说明即使全模型正确,但如果其中有一些自变量对因变量影响很小或回归系数方差过大,我们丢掉这些变量之后,用选模型去预测,可以提高预测的精度。由此可见,如果模型中包含了一些不必要的自变量,模型的预测精度就会下降。目录上页下页返回结束

2026/1/4中国人民大学六西格玛质量管理研究中心12§7.1自变量选择对估计和预测的影响(二)选模型正确而误用全模型的情况目录上页下页返回结束

2026/1/4中国人民大学六西格玛质量管理研究中心13§7.1自变量选择对估计和预测的影响一个好的回归模型,并不是考虑的自变量越多越好。在建立回归模型时,选择自变量的基本指导思想是“少而精”。目录上页下页返回结束

2026/1/4中国人民大学六西格玛质量管理研究中心14§7.1自变量选择对估计和预测的影响哪怕我们丢掉了一些对因变量y还有些影

文档评论(0)

1亿VIP精品文档

相关文档