- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学实验回归分析.
实验10 回归分析分1 黄浩 2011011743实验目的了解回归分析的基本原理,掌握MATLAB 实现的方法练习用回归分析解决实际问题实验内容1.《数学实验》第一版(问题2)问题叙述:电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表)。建立回归模型并进行检验,诊断异常点的存在并进行处理。每周收入9690959295959494电视广告费用1.52.01.52.53.32.34.22.5报纸广告费用5.02.04.02.53.03.52.53.0实验过程:本题是一个二元回归问题,为了了解数据点的整体特性(线性、非线性),我们先对上述数据点做3维的散点图。使用代码:y=[96 90 95 92 95 95 94 94];x1=[1.5 2.0 1.5 2.5 3.3 2.3 4.2 2.5];x2=[5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0];plot3(x1,x2,y,+);grid 经过旋转,找到了一个近似平面的位置:这说明两种广告费用都有可能分别独立地对每周收入有线性的关系,因此,不妨设y为每周收入,x1为电视广告费用,x2为报纸广告费用,建立二元线性回归的模型:使用代码:y=[96 90 95 92 95 95 94 94];x1=[1.5 2.0 1.5 2.5 3.3 2.3 4.2 2.5];x2=[5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0];n=8;X=[ones(n,1) x1 x2];[b bint r rint s]=regress(y,X);b,bint,s,rcoplot(r,rint) 所得结果整理为:回归系数估计值置信区间β083.211678.805887.6174β11.29850.40072.1962β22.33721.48603.1883R2Fps20.908924.94080.00250.4897因此,回归得到的公式为:因为三个回归系数的置信区间都不含零点,因此关于三个回归系数的原假设H0:βi=0都被推翻;而且因F(1,n-2)分布大于F值的概率p0.05,说明上述模型在整体上是有效的。同时,观察最后一行的其他数据,我们看到R2和F的数值都比较大,与刚才的假设检验是互相吻合的。同时,我们再看一下输出的残差和置信区间图:我们看到,第一个点的残差置信区间不含零点,而又因残差应服从均值为0的正态分布,因而我们认为该点是异常的,是离群点,应予以剔除。使用剔除离群点后的数据重新进行回归分析(代码省略),结果如下:回归系数估计值置信区间β081.488178.787884.1883β11.28770.79641.7790β22.97662.32813.6250R2Fps20.976884.38420.00050.1257从上表可见,当剔除离群点后,R2和F值都增大了,而且p和s2都减小了,这都说明,剔除离群点使得线性回归的精度得以提高,此时:而且,输出的残差和置信区间图如下所示:此时,离群点已经完全剔除,残差与正态分布基本吻合。(以下的讨论是一个不成功的尝试):进一步考虑,在实际生活中,电视广告和报纸广告是相辅相成的,两种媒介同时起作用时,可能会带来一些附加收益,即可能存在x1与x2的交互项。因为本题的数据点很少,难以进行书中的残差分析,因而我们直接使用二元二项式回归,以期找到更合适的拟合公式,使用代码(暂时保留了刚才找到的离群点):y=[96 90 95 92 95 95 94 94];x1=[1.5 2.0 1.5 2.5 3.3 2.3 4.2 2.5];x2=[5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0];x=[x1,x2];rstool(x,y);得到了一个交互式画面:然后,对该交互式画面提供的四种模型分别输出回归系数和剩余标准差,整理如下:Slinear83.21161.29852.3372------0.6998purequadratic76.30191.52806.6454-0.0779-0.6252--0.2496interaction88.8128-2.04170.29861.2280----0.4527Full quadratic85.4135-3.08213.88690.93400.2830-0.47490.1415由剩余标准差的比较可知,使用包含线性项和完全二次项的模型可以获得最小的剩余标准差,即数据的拟合更为精确。但同时,我们发现,这种模型下β3、β4、β5的值都远远小于β1、β2,这说明后三项起的作用不大,是影响不显著的变量,这种情况下虽然能获得更优的回归模型,但难以较好地从现实角度予以解释。同样,第二行给出的包含线性项和纯二次项的模型也存在上述问题。而第三行的回归模型既包含了交
您可能关注的文档
最近下载
- 一种钢铁综合废水浓盐水的减量化、资源化处理组合方法与系统.pdf VIP
- 《碳中和管理体系 要求》(征求意见稿).pdf
- 医院银行存款管理制度.docx VIP
- 新北师大版数学五年级上册第六单元“组合图形面积”单元试卷 .pdf VIP
- 人教版高中英语必修一全册教学课件.pptx
- 《工逆向工程与增材制造》课件——17. Geomagic Design X 草图建模方法 .pptx VIP
- 海姆立克急救法-(精).ppt VIP
- 北师大版九年级下册数学全册同步练习.docx VIP
- 2025全国青少年模拟飞行考核理论知识题库40题及参考答案1套.docx VIP
- 在线网课学习课堂《兵棋(中国人民武装警察部队警官学院)》单元测试考核答案.docx VIP
文档评论(0)