- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
欢迎共阅
回归模型的残差分析
山东 胡大波
判断回归模型的拟合效果是回归分析的重要内容,在回归分析中,通常用残差分析来判断回归模型的拟合效果。下面具体分析残差分析的途径及具体例子。
一、 残差分析的两种方法
区域的宽度越窄,说明模型的拟合精度越高,回归方程的预报精度越高。?n(
区域的宽度越窄,说明模型的拟合精度越高,回归方程的预报精度越高。
?n
(y?y^)2
2、可以进一步通过相关指数R2?1?
i
i
i?1
?n
i?1
来衡量回归模型的拟合效
(y?y)2
i
果,一般规律是R2越大,残差平方和就越小,从而回归模型的拟合效果越好。
二、
典例分析:
例1、某运动员训练次数与运动成绩之间的数据关系如下:
试预测该运动员训练47次以及55次的成绩。
解答:(1)作出该运动员训练次数x与成绩y之间的散点图,如图1所示,由散点图可
知,它们之间具有线性相关关系。
(2)列表计算:
次数/x
30
33
35
37
39
44
46
50
成绩/y
30
34
37
39
42
46
48
51
次数
成绩
x
i
y
i
30
30
900
900
900
33
34
1089
1156
1122
35
37
1225
1369
1295
37
39
1369
1521
1443
39
42
1521
1764
1638
44
46
1936
2116
2024
46
48
2116
2304
2208
50
51
2500
2601
2550
由上表可求得x?39.25,y?40.875,?8
x2?12656,?8
i
y2?13731,
i
i?1 i?1
欢迎共阅
欢迎共阅
?8 xy
?13180,所以??
?8(x
i
i?1
x)(y
i
y)
?8 xy
?i i
?
i?1
8xy
?1.0415.
i i
i?1
?8(x
i
i?1
?x)2
?8 x2
i
i?1
x2
??y??x??0.00302,所以回归直线方程为y^
(3)计算相关系数
?1.0415x?0.00302.
将上述数据代入r?
?8 xy
i i
i?1
8xy
得r?0.992704,查表可知
?8
i?1
(x2
i
?8x2)(?8
i?1
y2?8y2)
i
r
0.05
?0.707,而r?r
0.05
,故y与x之间存在显着的相关关系。
残差分析:
作残差图如图2,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适。
计算残差的方差得?2?0.884113,说明预报的精度较高。
计算相关指数R2
计算相关指数R2=0.9855.说明该运动员的成绩的差异有98.55%是由训练次数引起的。
做出预报
由上述分析可知,我们可用回归方程y^
预报值。
?1.0415x?0.00302.作为该运动员成绩的
将x=47和x=55分别代入该方程可得y=49和y=57,故预测运动员训练47次和55次的成绩分别为49和57.点评:一般地,建立回归模型的基本步骤为:
确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);
由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a);
按一定规则估计回归方程中的参数(如最小二乘法);
得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。
月人均收入x/月人均生活费y/例2、某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关
月人均收入x/
月人均生活费y/
元
元
300
255
390
324
420
335
520
360
570
450
700
520
760
580
800
600
850
630
1080
750
试预测人均月收入为1100元和人均月收入为1200元的两个家庭的月人均生活费。
解答:作出散点分布图如图,由图可知,月人均生活费与人均收入之间具有线性相关关系。
通过计算可知x?639,y?480.4,?10
x2?4610300,?10
i
y2?2540526,
i
i?1 i?1
?10xy
i i
i?1
?3417560,所以??
文档评论(0)