07第七章 相关与回归1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
07第七章 相关与回归1

总体方差的估计 回归分析的分类 根据变量的多少分为: 简单回归 多元回归 只有一个自变量和一个因变量的回归 自变量数目在两个或两个以上 根据建立的回归模型形式分为: 线性回归 非线性回归 从所拟合的回归模型来看,一变量表现为其它变量的线性组合。 从所拟合的回归模型来看,一变量表现为其它变量的非线性组合 回归分析与相关分析 理论和方法具有一致性; 无相关就无回归,相关程度越高,回归越好; 相关系数和回归系数方向一致,可以互相推算。 联系: 相关分析中x与y对等,回归分析中x与y要确定自变量和因变量; 相关分析中x、y均为随机变量,回归分析中只有y为随机变量; 相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。 回归分析与相关分析 区别: 简单线性回归模型 指根据成对的两个变量的数值,配合直线方程式,根据自变量的变动,来推算因变量发展变动趋势的方法,其模型为: 其中:Yi表示因变量Y在总体中某一个具体的观察值;Xi表示在研究总体中自变量X的具体观察数值;A与B是参数,称为回归系数;εi是一个随机变量,其平均数为0,方差为σ2. 总体回归模型 总体一元线性回归模型: 模型参数 误差项 假定: E(?)=0 总体一元线性回归方程: 在实际应用中,我们对X和Y所代表的总体往往不可能全面的观察和了解,而只能从中抽取部分资料作为样本,并通过样本提供的信息来认识总体,找出总体回归模型的估计式,其估计式的方程式可写为: 简单线性回归模型 其中:a,b和ei分别为A、B及εi的估计量。 由于抽样的随机性,使样本回归线不可能与总体回归完全重合,从而会出现样本回归函数高估或低估总体回归函数的情况,我们能做的就是设法使样本回归函数尽可能接近总体回归函数,也就是说要使回归方程参数的估计值a、b尽量接近总体真实参数A、B。 样本回归模型 一元线性回归方程的几何意义 截距 斜率 一元线性回归方程的可能形态 b为正 b为负 b为0 回归直线的拟合 总体一元线性 回归方程: 样本一元线性回归方程: 以样本统计量估计总体参数 斜率(回归系数) 截距 截距a 表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b 表明自变量x每变动一个单位,因变量y平均变动b个单位。 (估计的回归方程) 随机干扰:各种偶然因素、观察误差和其他被忽视因素的影响 X对y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。 残差:e 一元线性回归方程 中参数a、b的确定: 最小平方法 基本数学要求 整理得到由两个关于a、b的二元一次方程组成的方程组: 进一步整理,有: 95546 7426 8000 7776 9020 10292 10080 8840 10492 12180 11440 xy - 47.291 49.448 51.606 53.764 55.921 58.079 60.236 62.394 64.552 66.709 估计值 ? 1670 158 160 162 164 166 168 170 172 174 176 身高 x 0 33032 279220 570 ? -0.291 0.552 -3.606 1.236 6.079 1.921 -8.236 -1.394 5.448 -1.709 2209 2500 2304 3025 3844 3600 2704 3721 4900 4225 24964 25600 26244 26896 27556 28224 28900 29584 30276 30976 47 50 48 55 62 60 52 61 70 65 A B C D E F G H I J 残差 y-? y2 x2 体重 y 学生 【分析】因为工业总产值与能源消耗量之间存在高度正相关关系( ),所以可以拟合工业总产值对能源消耗量的线性回归方程。 【例】建立工业总产值对能源消耗量的线性回归方程 资料 解:设线性回归方程为 即线性回归方程为: 计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(八万吨),工业总产值将增加0.7961个单位(亿元)。 残差:e 利用直线回归方程,估计或预测出的因变量 数值 与实际值y可能一致,也可能不一致。因而就产生了估计值的代表性问题。S2是测定回归方程推算结果(估计值)的准确程度(代表性)的统计分析指标。 总体方差是总体随机误差项ε的方差σ2 。 σ2可以反映总体回归模型误差的大小。由于随机误差项本身是不能直接观测的.因此,需要用样本残差e的方差S2来估计σ2 。 式中, e是样本残差,分母是自由度,其中n是样本观测值的个数。 估计标准误差 S是测定样本回归线的代表性强弱的指标。S越小表明

文档评论(0)

153****9595 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档