- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实用标准文案
PAGE
精彩文档
实用标准文案
精彩文档
2013年数学建模第二次实战训练论文
题目 线性回归模型的预测
队员
姓名
系别
专业
1
小团
数学系
数学与应用数学
2
陈佩
数学系
数学与应用数学
3
邹灵弟
数学系
数学与应用数学
2013年8月21日
摘要
本文主要是根据所给的回归数据,利用软件建立线性回归模型,并根据所建立的数学模型来解决相应的实际问题。首先,根据杠杆原理,确定强影响点,其次,对所给的数据利用单样本K-S检验进行正态性检验,得出数据是符合正态分布的,并对回归数据进行相关性检验,得出 y对自变量有显著的线性关系。再次,利用条件数原理进行自变量的多重共线性检测,消除后得到模型。最后,利用残差的自相关性来进行模型的检验,并作出相应的预测。
问题重述
本文所给的回归数据如下表
行
Y
X1
X2
X3
X4
X5
X6
1
443
49
79
76
8
15
205
2
290
27
70
31
6
6
129
3
676
115
92
130
0
9
339
4
536
92
62
92
5
8
247
5
481
67
42
94
16
3
202
6
296
31
54
34
14
11
119
7
453
105
60
47
5
10
212
8
617
114
85
84
17
20
285
9
514
98
72
71
12
-1
242
10
400
15
59
99
15
11
174
11
473
62
62
81
9
1
207
12
157
25
11
7
9
9
45
13
440
45
65
84
19
13
195
14
480
92
75
63
9
20
232
15
136
27
26
82
4
17
134
16
530
111
52
93
11
13
256
17
610
78
102
84
5
7
266
18
617
106
87
82
18
7
276
19
600
97
98
71
12
8
266
20
480
67
65
62
13
12
196
21
279
38
26
44
10
8
110
22
446
56
32
99
16
8
188
23
450
54
100
50
11
15
205
24
335
53
55
60
8
0
170
25
459
61
53
79
6
5
193
26
630
60
108
104
17
8
273
27
483
83
78
71
11
8
233
28
617
74
125
66
16
4
265
29
605
89
121
71
8
8
283
30
388
64
30
81
10
10
176
31
351
34
44
65
7
9
143
32
366
71
34
56
8
9
162
33
493
88
30
87
13
0
207
34
648
112
105
123
5
12
34
35
449
57
69
72
5
4
200
36
340
61
35
55
13
0
152
37
292
29
45
47
13
13
123
38
688
82
105
81
20
9
268
39
408
80
55
61
11
1
197
40
461
82
88
54
14
7
225
本文需要解决的六个问题是:
检测强影响点,并求出杠杆值;
正态性检验;
相关性检验;
自变量的多重共线性检测,若有多重共线性,试消除,再建模;
残差的自相关分析,模型的合理性分析。
预测时的预测值。
模型假设
假设所给的数据真实、可靠;
假设未来的数据没有太大的变动;
假设所给数据都是随机的的变量。
符号说明
y的预测值;
第ij个数据的库克距离;
第ij个数据的杠杆值;
Sig 相伴概率;
问题分析
该问题主要是处理回归数据的问题,从而想到建立多元线性回归模型,由于是回归模型,所以我们选用SPSS软件来建立模型,但在建立模型之前必须做相关性的检验,检验都通过后,才能建立模型,并作出相应的预测。
模型建立与求解
5.1问题一模型建立与求解
5.1.1
由残差向量的方差阵公式:
可知,因为杠杆值大的观测点远离样本中心,较大的杠杆值的残差偏小,所以它能够把回归方程拉向自身,我们把杠杆值大的样本点称为强影响点。
由于强影响点并不总是因变量的异常值点,因而不能单纯根据杠杆值的大小判断强影响点是否异常。为此,我们引入库克距离来判断强影响点是否为因变量的异常值点。库克距离的计算公式为:
库克距离反映了杠杆值与残差大小的一个综合效应。
根据帽子矩阵的迹的公式:
则杠杆值的平均值为:
这样,杠杆值如果大于2倍或3倍的,我们就认为这个杠杆值是大
文档评论(0)