- 12
- 0
- 约1.34千字
- 约 23页
- 2020-11-30 发布于福建
- 举报
23残差分析
前面讨论的是线性回归模型的参数估计和有
关的统计推断,这些讨论都是在对模型作了一定
的假设进行的,其中最重要的是回归关系的线性
假设,误差项的独立同正态分布假设。当给定了
一批数据后,如何考察这些数据满足假设是回归
分析的一个重要环节
这些假设涉及到误差项,而误差是不可测的,
我们能够使用的是其估计量残差
从误差的估计值(残差)出发分析关于误差项
假定的合理性以及线性回归关系的假定的可行性称
为残差分析
2.3.1误差项的正态性检验
学生化残差
假设误差向量E~N(O,O2D)
则残差向量E~N(0,a2(1-H))
其中H是n阶对称幂等矩阵
H=X(XXX
故
E1~N(0,(1-h1),=1,2,
其中h1=x2(XX)x
是H主对角线的第i个元素,称为
杠杆量
由于残差的方差和杠杆量有关,故一般情况
下,残差的方差不相等,这不利于残差的应用,,
因此我们将残差标准化。
MSE(I-h,i)
称为学生化残差,当n较大时,可认为其服从
标准正态分布。这是检验误差项独立同正态分布
的基础。
残差正态性的频率检验
残差正态性的频率检验是一种很直观的检验
方法,其基本思想是学生化残差落入一些范围的
频率与标准正态分布在相应范围内的概率做比较,
若二者相差较大,则认为残差(从而模型误差)
不服从正态分布
在实际应用中,一般取几个具有代表性的区间
进行比较。例如(-1,1)(-1.5,1.5)(2,2)
服从标准正态分布的随机变量取值在(-1,1)
内的概率为0.68;在(-1.5,1.5)内的概率为0.87;
在(-2,2)内为0.95,因此若模型误差项独立同
正态分布,则当n较大时,学生化残差中应大约有
68%的点落在在(-1,1)内;大约有87%在(
1.5,1.5)内,大约95%在(-2,2)内
若在某个区间内差异较大,则有理由怀疑误差
独立同正态分布的假设的合理性
残差的正态qq图检验
(1)学生化残差正态q图做法
1)写出学生化残差的演统计量:1,12,…,m
2)对每个=12…,n计算90=4(m+025)
3)在坐标系中描出点n,)
则所得的散点图即为学生化残差的正态q图,
利用正态qq图可以直观检验误差正态性假设的合
理性
(2)相关系数检验
除了上述直观检验外,我们还可以构造两者
的相关系数来度量二者之间线性关系的强弱。其
相关系数估计为
(-7)∑(q-0
若p接近于1,则散点图上点大致在一条直线上
2.3.2残差图的分析
残差图是以残差为纵坐标,以其他有关量为横
坐标的散点图
通过考察不同类型残差图可以对误差项分布的
正态性,等方差性以及回归关系的线性性等假定的
合理性作出直观检测,还可以对回归方程是否有必
要引进自变量的高次项、交叉项等提供参考
(1)以因变量Y的拟合值为横坐标的散点图
若线性回归关系正确且误差服从正态分布,则
因变量的拟合值与残差向量相互独立。这时残差图
中的点应大致在一个水平的带状区域内,没有任何
明显地趋势,如下图
您可能关注的文档
最近下载
- 口腔数字化修复技术30课件.pptx VIP
- 《儿童血压测量规范》解读.pptx
- 中卫焦化厂冷凝鼓风工段初步设计.docx VIP
- 《心理学在管理中的应用》课件.ppt VIP
- 2026年黑龙江民族职业学院单招职业技能考试题库完整答案详解.docx VIP
- 第2课《幸福生活是奋斗出来的》教案-2025-2026学年第二学期三年级道德与法治统编版下册.docx
- 2025广东事业单位真题及答案.docx VIP
- 2026青海省公务员考试常识判断专项练习题有完整答案.docx VIP
- 银行保安服务 投标方案(技术方案).doc
- 2026中国藏语系高级佛学院招聘应届高校毕业生6人备考题库及一套参考答案详解.docx VIP
原创力文档

文档评论(0)