- 1189
- 2
- 约6.95千字
- 约 6页
- 2021-01-07 发布于江苏
- 举报
第 5 章 自变量选择与逐步回归
思考与练习参考答案
5.1 自变量选择对回归参数的估计有何影响?
答 回归自变量的选择是建立回归模型得一个极为重要的问题。如果模型中丢
掉了重要的自变量, 出现模型的设定偏误,这样模型容易出现异方差或自相关
性 ,影响回归的效果;如果模型中增加了不必要的自变量, 或者数据质量很差
的自变量, 不仅使得建模计算量增大, 自变量之间信息有重叠,而且得到的模型
稳定性较差,影响回归模型的应用。
5.2 自变量选择对回归预测有何影响?
答 当全模型(m 元)正确采用选模型(p 元)时,我们舍弃了 m-p 个自变量,
回归系数的最小二乘估计是全模型相应参数的有偏估计,使得用选模型的预测是
有偏的,但由于选模型的参数估计、预测残差和预测均方误差具有较小的方差,
所以全模型正确而误用选模型有利有弊。 当选模型(p 元)正确采用全模型(m
元)时,全模型回归系数的最小二乘估计是相应参数的有偏估计,使得用模型的
预测是有偏的,并且全模型的参数估计、预测残差和预测均方误差的方差都比选
模型的大,所以回归自变量的选择应少而精。
5.3 如果所建模型主要用于预测,应该用哪个准则来衡量回归方程的优劣?
答 如果所建模型主要用于预测,则应使用C 统计量达到最小的准则来衡量回
p
归方程的优劣。
5.4 试述前进法的思想方法。
答 前进法的基本思想方法是:首先因变量 Y 对全部的自变量 x1,x2,...,xm 建立 m
个一元线性回归方程, 并计算 F 检验值,选择偏回归平方和显著的变量(F 值最
大且大于临界值)进入回归方程。每一步只引入一个变量,同时建立 m -1 个二
元线性回归方程,计算它们的 F 检验值,选择偏回归平方和显著的两变量变量(F
值最大且大于临界值)进入回归方程。在确定引入的两个自变量以后,再引入一
个变量,建立 m -2 个三元线性回归方程,计算它们的 F 检验值,选择偏回归平
方和显著的三个变量(F 值最大)进入回归方程。不断重复这一过程,直到无法
再引入新的自变量时,即所有未被引入的自变量的 F 检验值均小于 F 检验临界
值 F α(1,n-p-1),回归过程结束。
5.5 试述后退法的思想方法。
答 后退法的基本思想是:首先因变量 Y 对全部的自变量 x1,x2,...,xm 建立一个 m
元线性回归方程, 并计算 t 检验值和 F 检验值,选择最不显著(P 值最大且大于
临界值)的偏回归系数的自变量剔除出回归方程。每一步只剔除一个变量,再建
立 m -1 元线性回归方程,计算 t 检验值和 F 检验值,剔除偏回归系数的 t 检验
值最小(P 值最大)的自变量,再建立新的回归方程。不断重复这一过程,直到
无法剔除自变量时,即所有剩余 p 个自变量的 F 检验值均大于 F 检验临界值 F α
(1,n-p-1),回归过程结束。
5.6 前进法、后退法各有哪些优缺点?
答 前进法的优点是能够将对因变量有影响的自变量按显著性一一选入,计算量
小。前进法的缺点是不能反映引进新变量后的变化,而且选入的变量就算不显著
也不能删除。后退法的优点是是能够将对因变量没有显著影响的自变量按不显著
性一一剔除,保留的自变量都是显著的。后退法的缺点是开始计算量大,当减少
一个自变量时,它再也没机会进入了。如果碰到自变量间有相关关系时,前进法
和后退法所作的回归方程均会出现不同程度的问题。
5.7 试述逐步回归法的思想方法。
答 逐步回归的基本思想是有进有出。具体做法是将变量一个一个的引入,当每
引入一个自变量后,对已选入的变量要进行逐个检验,当原引入变量由于后面变
量的应纳入而变得不再显著时,要将其剔除。引入一个变量或从回归防方程中剔
除一个变量,为逐步回归的一步,每一步都要进行 F 检验,以确保每次引入新的
变量之前回归方程中只包含显著的变量。这个过程反复进行,直到无显著变量引
入回归方程,也无不显著变量从回归方程中剔除为止。这样就避免了前进法和后
退法各自的缺陷,保证了最后得到的回归子集是最优回归子集。
5.8 在运用逐步回归法时,α 和α 的赋值原则是什么?如果希望回归方程中
进 出
多保
原创力文档

文档评论(0)