回归分析1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
回归分析1.ppt

* * 第一讲:一元线性与非线性回归分析 引例:钢材消费量与国民收入的关系 一元回归模型与回归分析 MATLAB软件实现 简介一元 非线性回归模型 实验 为了研究钢材消费量与国民收入之间的关系,在统计年鉴上查得一组历史数据。 引例:钢材消费量与国民收入的关系 3155 2736 1979 …… …… …… 1502 988 1966 3372 2948 1284 1097 收入(亿) 2825 1446 872 698 消费(吨) 1980 1978 1965 1964 年 份 试分析预测若1981年到1985年我国国民收入以4.5%的速度递增,钢材消费量将达到什么样的水平? 钢材消费量--------试验指标(因变量)Y; 国民收入-----------自变量 x; 建立数据拟合函数 y = E(Y | x)= f(x); 作拟合曲线图形分析。 问题分析: 钢材消费量y与国民收入x的散点图 y=a+bx 回归分析是研究变量间相关关系的一种统计分析。 特点:试验指标(因变量)是随机变量。 图形解释:y = E(Y | x)= f(x) 假设:f(x) = ax+b x x0 E(Y|x0) y 0 . . . . . . . . x1 E(Y|x1) · · · · · · 假设: (y = E(Y | x)= f(x)) 1)Y是一个正态随机变量,即Y服从正态分 布,并且有方差 D(Y)=σ2。 2)根据观测值作的散点图,观察出函数f(x) 是线性形式还是非线性形式。 回归模型及回归分析 1、一元线性回归模型 或 需要解决的问题: 1) 在回归模型中如何估计参数a、b和σ2? 知识介绍 2) 模型的假设是否正确?需要检验。 3)利用回归方程对试验指标y进行预测或控制? 参数估计 设观测值为(xi, yi)(i=1,2,…,n), 代入模型中,yi = a + bxi +εi 解出的参数记为 则回归方程: 最小二乘法: 回归模型的假设检验 提出问题: 1、相关系数检验 | r |≤1 | r |→1,线性相关 | r |→0,非线性相关 模型:Y = a + bx +ε H0的拒绝域为: ( ) -1 1 | | · 0 rα(n-2) -rα(n-2) 2、F-检验法 平方和分解公式: 记为 实测值 估计值 残差值,剩余平方和,越小越好 认为线性回归效果好 预测与控制 给定的自变量x0,给出E(y0)的点估计量: y0的置信度为(1??)%的预测区间为: 设y在某个区间(y1, y2)取值时, 应如何控制x的取值范围, 这样的问题称为控制问题。 小结: 或 模型 1、估计参数a,b,σ2; 2、检验模型正确与否;(即b→0) 3、预测或控制; 已知数据(xi, yi)(i =1,2,…,n), 如何利用MATLAB软件实现以上的统计计算? MATLAB软件实现 使用命令regress实现一元线性回归模型的计算 b = regress (Y, X) 或 [b, bint, r, rint, stats] = regress(Y, X, alpha) 回归系数a,b以及它们的置信区间 残差向量e=Y-Y及它们的置信区间 相关系数R2,F-统计量和与χ0对应的概率p。 残差及其置信区间可以用rcoplot(r,rint)画图。 默认值是0.05 引例求解 输入:(hg1.m) x=[1097 1284 1502 1394 1303 1555 1917 2051 2111 2286 2311 2003 2435 2625 2948 3155 3372]; y=[698 872 988 807 738 1025 1316 1539 1561 1765 1762 1960 1902 2013 2446 2736 2825]; X=[ones(size(x)),x],pause [c,cint,r,rint,stats]=regress(y,X,0.05),pause rcoplot(r,rint) 输出: c = -460.5282 (参数a) 0.9840 (参数b) cint = -691.8478 -229.2085 ( a的置信区间 ) 0.8779 1.0900 ( b的置信区间 ) r = [ 79.1248 69.1244 -29.3788 -104.1112 -83.5709 -44.5286 -109.7219

文档评论(0)

docinppt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档