第三讲回归诊断.docVIP

  • 15
  • 0
  • 约3.84千字
  • 约 9页
  • 2017-06-05 发布于安徽
  • 举报
第三章 回归诊断 §3.1 引言 在前两章讨论一元与多元线性回归问题中,我们作了如下一些假定: 是的线性函数; 随机误差相互独立,并且满足:; 服从正态分布。 在实际中这些假定是否合理?如果实际数据与这些假设偏离比较大,那么前而讨论的有关参数的区间估计,假设检验就不再成立。如果经过分析,已经确认对所研究的具体,上面的假设不成立,那么我们又希望探讨对数据作怎样的修正后,能使它们满足或近似满足这些假设。这些就是回归诊断中所要解决的第一个问题。 回归诊断的另一个研究的问题是对数据的诊断,探查对统计推断有较大影响的试验点,这样的点称为强影响点。 §3.2 残差及残差图 普通残差 在第三章中,我们假定,此时模型的最小二乘估计为: ,由此可得拟合向量: , 其中。 记:,则称残差向量。残差向量是我们进行回归诊断的重要工具。容易验证:,即矩阵是幂等对称矩阵。由第二章的讨论可知: 当时, 我们可以看出普通残差与之间有着密切的关系,为此进一步讨论的性质 如下: 定理3.1 (1) ,且时,。 (2) , 其中为自变量个数。 证明:(1)因为,所以有 故有:,由此可得。 (2) 事实上,对一元线性回归方程来说: (证明可参见[1]p97-99)。由此可知的最小值为,当时达到;且随着远离中心,增大。当离中心充分远时,能够充分接近于1。 通常称很大的点为高

文档评论(0)

1亿VIP精品文档

相关文档