- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学实验报告实验10 回归分析
PAGE \* MERGEFORMAT21
实验10 回归分析
分1 黄浩 2011011743
实验目的
了解回归分析的基本原理,掌握MATLAB 实现的方法
练习用回归分析解决实际问题
实验内容
1.《数学实验》第一版(问题2)
问题叙述:
电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表)。建立回归模型并进行检验,诊断异常点的存在并进行处理。
每周收入9690959295959494电视广告费用1.52.01.52.53.32.34.22.5报纸广告费用5.02.04.02.53.03.52.53.0实验过程:
本题是一个二元回归问题,为了了解数据点的整体特性(线性、非线性),我们先对上述数据点做3维的散点图。
使用代码:
y=[96 90 95 92 95 95 94 94];
x1=[1.5 2.0 1.5 2.5 3.3 2.3 4.2 2.5];
x2=[5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0];
plot3(x1,x2,y,+);
grid 经过旋转,找到了一个近似平面的位置:
这说明两种广告费用都有可能分别独立地对每周收入有线性的关系,因此,不妨设y为每周收入,x1为电视广告费用,x2为报纸广告费用,建立二元线性回归的模型:
y=β0+β1x1+β2x2
使用代码:
y=[96 90 95 92 95 95 94 94];
x1=[1.5 2.0 1.5 2.5 3.3 2.3 4.2 2.5];
x2=[5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0];
n=8;
X=[ones(n,1) x1 x2];
[b bint r rint s]=regress(y,X);
b,bint,s,
rcoplot(r,rint) 所得结果整理为:
回归系数估计值置信区间β083.211678.805887.6174β11.29850.40072.1962β22.33721.48603.1883R2Fps20.908924.94080.00250.4897因此,回归得到的公式为:
y=83.2116+1.2985x1+2.3372x2
因为三个回归系数的置信区间都不含零点,因此关于三个回归系数的原假设H0:βi=0都被推翻;而且因F(1,n-2)分布大于F值的概率p0.05,说明上述模型在整体上是有效的。同时,观察最后一行的其他数据,我们看到R2和F的数值都比较大,与刚才的假设检验是互相吻合的。
同时,我们再看一下输出的残差和置信区间图:
我们看到,第一个点的残差置信区间不含零点,而又因残差应服从均值为0的正态分布,因而我们认为该点是异常的,是离群点,应予以剔除。使用剔除离群点后的数据重新进行回归分析(代码省略),结果如下:
回归系数估计值置信区间β081.488178.787884.1883β11.28770.79641.7790β22.97662.32813.6250R2Fps20.976884.38420.00050.1257从上表可见,当剔除离群点后,R2和F值都增大了,而且p和s2都减小了,这都说明,剔除离群点使得线性回归的精度得以提高,此时:
y=81.4881+1.2877x1+2.9766x2
而且,输出的残差和置信区间图如下所示:
此时,离群点已经完全剔除,残差与正态分布基本吻合。
(以下的讨论是一个不成功的尝试):
进一步考虑,在实际生活中,电视广告和报纸广告是相辅相成的,两种媒介同时起作用时,可能会带来一些附加收益,即可能存在x1与x2的交互项。因为本题的数据点很少,难以进行书中的残差分析,因而我们直接使用二元二项式回归,以期找到更合适的拟合公式,使用代码(暂时保留了刚才找到的离群点):
y=[96 90 95 92 95 95 94 94];
x1=[1.5 2.0 1.5 2.5 3.3 2.3 4.2 2.5];
x2=[5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0];
x=[x1,x2];
rstool(x,y);得到了一个交互式画面:
然后,对该交互式画面提供的四种模型分别输出回归系数和剩余标准差,整理如下:
β0β1β2β3β4β5Slinear83.21161.29852.3372------0.6998purequadratic76.30191.52806.6454-0.0779-0.6252--0.
您可能关注的文档
最近下载
- SUZUKI铃木UU125T摩托车维修手册.pdf VIP
- 公路及市政道路用高强透水水泥混凝土路面技术规程 条文说明.pdf VIP
- mike 2016 feflow指南中fepestuser manualfepest用户手册.pdf VIP
- 网格员防诈骗宣传知识讲座.pptx VIP
- 勘测定界 标书 设计书 测绘方案.docx VIP
- 《JTGD20-2006-公路路线设计》.pdf VIP
- 公路及市政道路用高强透水水泥混凝土路面技术规程.pdf VIP
- 2017年考研英语一真题及答案.pdf VIP
- FX-501-C2简易操作说明.doc VIP
- 北师大版小学数学二年级上册第二单元 测量(一)综合素养测评卷(含答案).pdf VIP
文档评论(0)