- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
模拟建模论文(应用回归分析)spss
楚雄师范学院
2012年数学建摸模拟论文
题 目 应用回归分析
???? ????姓 名 韩金伟
?????????系 (院) 数学系09级01班
?????????专 业 数学与应用数学
2012 年8月 22 日
题目:应用回归分析
摘要:随着社会经济的不断发展,科学技术的不断进步,统计方法越来越成为人们必不可少的工具和手段。应用回归分析是其中的一个重要分支,数据处理,数据检验,模型的建立和检验都是回归分析不可缺少的部分。针对多组数据的多个变量样本,我们通常都会对它建立回归模型,在此建模过程中我们就要对给定的数据做合理化检验分析,找出数据的规律,再对数据进行分类建模。当然,因为各变量之间或多或少都会存在强影响的变量,所以通常都要做剔除性检验和重新建模,最后建立出一个合理化的模型。
关键词:回归分析 相关性 自相关 残差 异常点 正态性 杠杆值
一、问题重述
(10.1 附录一)中给定了一些关于自变量与因变量的一些数据,请按所给的要求对给定的数据进行分析:
要求:1.检测强影响点,并求出杠杆值.
2.正态性检验.
3.相关性检验.
4.自变量的多重共线性检测,若有多重共线性,试消除,再建模.
5.残差的自相关性分析,模型的合理性分析.
6.预测时的预测值.
问题分析
本题是要针对一组数据做合理化的线性分析,先后要求对数据做了异常值的检验和剔除,各变量的正态性检验,在从相关性的角度对各变量做相关性检验,得出数据是否适合做多元线性规划模型。为了使建立的模型具有很好的拟合效果和实际意义,又要求对各变量做相关性检验的同时进而做多重共线性的诊断,从中发现自变量之间是否存在着多重共线性。在有多重共线性的情况下,为了消除多重共线性的影响,我们又要做剔除不合理的变量再做回归模型。当然在做好的模型中,我们又要剔除不能通过t检验的变量,最后建立没有强多重共线性,没有异常点且通过了F检验,t检验的合理化模型,再对给定的数据做出预测。
模型假设
假设y为因变量,为自变量,y 因变量y,X1 自变量x1,X2 自变量x2,X3 自变量x3,X4 自变量x4,X5 自变量x5,X6 自变量x6, 第i个值的残差, 第i个值的学生化残差, 第i个值的删除残差, 第i个值的删除学生化残差, 第i个值的杠杆值, 平均杠杆值。
四、符号说明
符号 意义 符号 意义 id 序列号 第i个值的库克距离 y 因变量y 第i个值的马氏距离 X1 自变量x1 条件数 X2 自变量x2 X 矩阵 X3 自变量x3 系数 X4 自变量x4 VIF 方差扩大因子 X5 自变量x5 DW DW检验 X6 自变量x6 条件索引 第i个值的残差 F F检验 第i个值的学生化残差 t T检验 第i个值的删除残差 平均数 第i个值的删除学生化残差 随机序列项 第i个值的杠杆值 S 样本偏度系数 平均杠杆值 B 样本峰度系数
五、模型建立和求解
1、问题一的求解
1.1 检测数据中的强影响点
1.1.1 对数据中的强影响点进行初略的箱图检
从绘制的箱图来看数据存在着强影响点,初步可以看出强影响点分别在的3号位和12号位,的34号位。为了进一步的检测出强影响点的位置和数据,减小强影响点对整体数据的影响,我们进一步对强影响点进行分析。
1.1.2 异常值分析
为了更好的检测出异常值,我们分别用计算机计算出数据的普通残差,学生化残差,删除残差,删除化学生化残差,杠杆值,库克距离,见下表。
行
id 普通残差
学生化残差 删除残差
杠杆值
库克距离
MaH距离
1 8.86556 0.2598 10.00927 0.2561 0.08927 0.00124 3.48134 2 -5.93733 -0.18289 -7.40626 -0.18019 0.17334 0.00118 6.76013 3 2.67499 0.09436 4.37602 0.09293 0.36372 0.00081 14.18495 4 25.37151 0.74016 28.38717 0.73498 0.08123 0.0093 3.1681 5 6.59825 0.19725 7.75207 0.19435 0.12384 0.00097 4.82977 6 0.2804 0.0083 0.32325 0.00
文档评论(0)