- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数学建模_统计回归模型
第6组:潘光松,刘博,杜晶
习题10-6
问题:某公司想用全行业的销售额作为自变量来预测公司的销售量,表中给出了1977—1981年公司的销售额和行业销售额的分季度数据(单位:百万元)
画出数据的散点图,观察用线性回归模型拟合是否合适。
建立公司销售额对全行业的回归模型,并用DW检验诊断随机误差项的自相关性。
建立消除了随机误差项自相关性之后的回归模型。
分析与假设:
表中的数据是以时间为顺序的。由于前期的销售额对后期的投资一般有明显的影响,从而对后期的后期的销售额造成影响。因此在此模型中因考虑到出现自相关型时,建立新的回归模型。
记公司公司的销售额为y,全行业的销售额为x,利用x来建立y的预测模型。
基本回归模型:
为了大致分析y和x的关系,首先利用表中的数据作出y对x关系作出散点图,如下(见图中的+)):
做散点图:
x=A(:,2); y=A(:,1); plot(x,y,+)
图一
从图一中可以看出,随着x的增加,y的值有比较明显的线性增长趋势,图中的直线是用线性模型,因此可建立一元线性回归模型
y=β0+β1x+ε (1)
拟合的(其中ε是随机误差),这里假设ε(对t相互独立)且服从N(0, ).
根据表中的数据,对模型(1)直接利用matlab统计工具箱求解、算法如下:
xx=[ones(20,1),x];
[b,bint,r,rint,stats]=regress(y,xx);hold on;
yy=b(1)+b(1)*x;
plot(x,yy)
hold off;
得到的回归系数估计值及其置信区间(α=0.05),检验统计量R,F,P的结果如表1:
参数 参数估计值 参数置信区间 β0 -1.4548 【-1.9047 -1.0048】 β1 0.1763 【0.1732 0.1793】 R=1.0e+004 *0.0001 F=1.0e+004 *1.4888 P=1.0e+004 *0.0000 表1 模型(1)的计算结果
将参数的估计值带入(1)中得到
yy=-1.4548+0.1763*x (2)
用matlab中的restool命令得到的交互式画面见图2,由此可以得出不同水平下的预测值及其置信区间。通过左下方的Export下拉式菜单。可以输出模型的统计结果。
rstool(x,y)
得出y1= 24..569+/-0.051307 当x=147.625时
且通过Export下拉菜单可得出beta 0=-1.4548,beta1=0.1763
rmse(剩余标准差)= 0.086056
图二
自相关性诊断与处理方法
从表面上来看得到的基本模型(2)拟合度非常高,接近你100%,应该很满意了,但是这个模型并没有考虑到我们的数据是一个时间序列(将原表中的数据打乱不影响,模型(2)的结果)。实际上对于时间序列数据做回归分析时,模型的随机误差ε有可能存在相关性,违背模型 关于ε(对时间t)相互独立的基本假设,其他相关因素对公司销售额的影响肯能也有时间上的延续,即误差ε会出现自相关性。
残差e=y-yy, yy 为估计值
e可作为随机误差ε的估计值,画出e ~e的散点图,能够直观的判断ε的自相关性,模型(2)的残差可在计算过程中得到表2,以及数据e ~e的图见图3
做残差图:
plot(x,r,+)
t 1 2 3 4 5 e -0.0282 -0.0642 0.0198 0.1616 0.0443 t 6 7 8 9 10 e 0.0441 0.0412 -0.0608 -0.0968 -0.1516 t 11 12 13 14 15 e -0.1505 -0.0555 -0.0255 0.1033 0.0828 t 16 17 18 19 20 e 0.1034 0.0263 0.0395 -0.047 -0.0359 表2
为了对ε的字相关性做定量的诊断,并在确诊后得到新的结果,我们考虑如下模型
y=β0+β1x+ε,ε=Pε+u,
其中p是自相关系数,|p|=1,u相互独立且服从均值为0的正态分布,t=1,2,,,,,n;
若p=0,则退化为普通的回归模型;若p0,则随机误差ε存在正的自相关;若p0,则随机误差ε存在负的自相关。
利用D-W检验诊断自相关现象如下:
e=y-yy;ee=e(2:20,:);eee=e(1:19,:);
y0=sum((ee-eee).^2);
y1=sum(ee.^2);DW=y0/y1;p=1-0.5*DW;
算出
y0 =
您可能关注的文档
- 摄影大赛 主持人手卡.doc
- 摄影摄像_摄影摄像器材.doc
- 摄影摄像器材使用管理制度.doc
- 摄影测量毕业论文中英文资料外文翻译文献.doc
- 摄影测量毕业论文.doc
- 摄影基础培训讲义.ppt
- 摇臂钻床维护检修规程.doc
- 摇臂连杆设计说明书.doc.doc
- 摩托车油箱的双组份UV罩光技术.doc
- 摇船调课件.ppt.ppt
- 中国国家标准 GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- 《GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计》.pdf
- 中国国家标准 GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- 《GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置》.pdf
- 中国国家标准 GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- GB/T 17889.4-2024梯子 第4部分:铰链梯.pdf
- 《GB/T 17889.4-2024梯子 第4部分:铰链梯》.pdf
文档评论(0)