回归分析(3)多元逐步回归.ppt

§ 2.5 多元逐步回归算法原理 ; 为了得到一个稳健的、可靠的回归模型,这就需要给出一种方法,使得能从影响 的因素中自动根据某种准则将 对 贡献大的变量 (或者说对 重要的变量 )引入方程,不重要的变量从方程中剔除。最终在观测数据基础上建立最优的回归方程。 ;§2.5.1 逐步回归算法的形成思路 ; 如此继续下去,假设已经进行到 步,那第 步是在未选的变量中选出这样一个变量,它与已选入回归方程的变量组成 元回归方程,比其他余下的任何一个变量组成的 元回归方程,有更大的回归平方和。 逐步回归不仅考虑到按贡献大小逐一挑选重要变量,而且还考虑到较早选入回归方程的某些变量,有可能随着其后一些变量的选入而失去原有的重要性,这样的变量也应当及时从回归方程中剔除,使回归方程中始终只保留重要的变量。; 如 引入方程后,再引入 ,也许由 的引 入而 的重要性反而变得不重要,应及时剔除。 假设已有 个自变量引入回归方程,即已知回 归方程是: 此时该方程相应的总离差平方和记为 ;§2.5.2 引入自变量的依据 ;;统计理论表明,用统计量 可以检验自变量 是否可以引入方程。式中, 是样本容量, 是已进入方程的自变量个数。 对于给定水平 ,查 分布表,可得临界 值 。如果 ,则表明 可引入方程; ;;§2.5.3 剔除自变量的依据 ;该方程的总离差平方和记 为由式(2.16)与式(2.17)可得 这里仍然称 为 对 的方差贡献。 ;;对于给定的水平 ,查 分布表得临界 值 。 如果 ,则 应从方程中剔除; 如果 ,则 不应从方程中剔除。 同样需要说明的是,实际问题可能有多个 ,由于每次只能从方程中剔除一个变 量,因此在算法上,我们选最小的 值所对应 的变量考虑剔除,即先求 ;;§ 2.6 逐步回归的计算步骤 ;§2.6.1 数据准备 ;;该变换使变换后的数据各变量均值为0,离差 平方和为l。 ;;§2.6.2 建立正规方程组 ;;§2.6.3 逐步计算 ;(2.21) ;;;§2.6.4 计算最终结果 ;3.回归值与偏差值 ,偏差 (2.27) 4.复相关系数 和剩余标准差 最后还可根据 进行 的区间估计。至于回归方 程的 检验与多元回归相同。

文档评论(0)

1亿VIP精品文档

相关文档