matlab预测1回归分析.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
先来看两个例子: 问题1 (血压与年龄)为了了解血压随着年龄的增长而升高的关系,调查了30个成年人的血压,如表所示,我们希望用这组数确定血压与年龄之间的关系,并且由此从年龄预测血压可能的变化范围。表1序号血压年龄序号血压年龄序号血压年龄114439111626421136362215471215056221425031384513140592312039414547141103424120215162651512842251604461424616130482615853717067171354527144638124421811418281302991586719116202912525101545620124193017569模型:记血压为y,年龄为x,可以做出如上图所示的散点图,从图形上直观的可以看出,y与x大致呈线性关系,即有:需要由数据确定系数 的估计值 。此函数为一元线性函数!! 问题2 (血压与年龄,体重指数,吸烟习惯) 世界卫生组织颁布的“体重指数”的定义是体重(kg)除以身高(m)的平方,下表给出了30个人的体重指数等数据,其中,0表示不吸烟,1表示吸烟,怎么考虑吸烟这个因素,此因素对于血压升高有影响吗,并对体重指数为25,50岁的吸烟者的血压做出预测。表2序号血压年龄体重指数吸烟习惯序号血压年龄体重指数吸烟习惯序号血压年龄体重指数吸烟习20111626428.01211363625.0022154731.11121505625.80221425026.2131384522.60131405927.30231203923.5041454724.01141103420.10241202120.3051626525.91151284221.70251604427.1161424625.10161304822.21261585328.6171706729.51171354527.40271446328.3081244219.70181141818.80281302922.0191586727.21191162022.60291252525.30101545619.30201241921.50301756927.41模型:记血压为 ,年龄为 ,体重指数为 ,吸烟习惯为 ,用Matlab将 与 的数据做散点图,看出大致也呈线性关系,建立模型:由数据估计系数 ,也可看做曲面拟合(其实为超平面)第三讲 MATLAB预测方法(1)回归分析多元线性回归 b=regress( Y, X )1、确定回归系数的点估计值:置信区间 显著性水平(缺省时为0.05)回归系数的区间估计残差用于检验回归模型的统计量,有三个数值:R2、F值、与F对应的概率p、以及残差的方差的估计值2、求回归系数的点估计和区间估计、并检验回归模型: [b, bint,r,rint,stats]=regress(Y,X,alpha)3、画出残差及其置信区间: rcoplot(r,rint)问题1的求解:y=[……]; %已知的因变量数组x=[……]; %已知的自变量数组n=……; %已知的数据容量X=[ones(n,1),x’]; %1与自变量组成的输入矩阵[b,bint,r,rint,s]=regress(y’,X); %回归分析程序(显著性水平为0.05)b, bint, s, %输出回归系数及其置信区间和统计量 rcoplot(r,rint) %残差及其置信区间作图输出结果为:b=98.40840.9732bint = 78.7484 118.0683 0.5601 1.3864s = 0.4540 23.2834 0.0000 273.7137回归系数回归系数估计值回归系数置信区间98.4084[74.7484, 118.0683]0.9732[0.5601 1.3864]R2=0.4540 F=23.2834 p0.001 s2=273.7137结果整理为下表: 从以下几点可以看出模型是有效的:参数的置信区间不含0点;p小于显著性水平;用Matlab可以求出F1-α(1,n-2)=4.1960,显然小于F值。 但是由于β1的置信区间过长,R2较小,说明模型的精度不高!残差图如图所示:图中第二个点的残差置信区间中不包含0点,由于残差服从均值为0的正态分布,因此可以认为这个点为异常数据,偏离数据整体的变化范围,应该剔除,重新进行回归分析!!残差与残差区间杠杆图,最好在0点线附近比较均匀的分布,而不呈现一定的规律性,如果

文档评论(0)

118zhuanqian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档