网站大量收购独家精品文档,联系QQ:2885784924

第五讲相关分析与回归分析概要1.ppt

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五讲相关分析与回归分析概要1

* R=0.98 * * * * * * * * 解:将前面计算表中的有关数据代入求参数a、b的标准方程,得: 人均收入与商品销售额的直线回归方程为: 五、回归分析与相关分析的区别 相关分析中,变量 x 与 y 处于平等地位;回归分析中具有相关关系的变量之间地位是非对等的,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量 相关分析主要描述变量之间相关关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行估计和预测 六、回归估计标准误差 建立了回归方程以后,通常要用方程估计值Yc来推断或预测实际值Y。为了分析用Yc去估计Y是否准确可靠,常采用反映回归直线代表性好坏的统计分析指标,检验方程回归系数的拟合优劣程度。为此需要进行变差分析。 六、回归估计标准误差 六、回归估计标准误差 1.直线回归的变差 因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面: 由于自变量 x 的取值不同造成的; 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响。 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差(离差) 来表示。 n个观察值的总变差( )的计算公式为:(总离差平方和) 回归平方和 (回归变差) 残差平方和 (剩余变差 或随机变差) 检验统计量 三个平方和的意义 1.总平方和 反映因变量的 n 个观察值与其均值的总离差 2.回归平方和 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和。 3.残差平方和 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和。 2.回归估计标准误差 1、当yc(估计值或 )与y(实际值)有偏差的时候,产生估计值代表性问题。 回归估计标准误差的公式: 一元回归的标准误差公式为: 七、回归模型的检验 回归方程的检验一般包括两个方面的内容: 一是线性关系的检验 二是回归系数的检验 1.线性关系的检验 具体方法是将回归离差平方和同剩余离差平方和加以比较,应用F检验来分析二者之间的差别是否显著。检验的具体步骤如下: 第一步,提出假设。 H0:b=0, H1:b≠0: 第二步,计算检验统计量F。 在原假设成立的情况下,F统计量服从F分布,第一自由度为1,第二自由度为n-2,即F~F(1,n-2)。 1.线性关系的检验 表1 产品产量与生产费用相关表 从上表可看出,产品产量与生产费用之间存在一定的正相关关系。 例:以表1的资料为例,对其回归模型作F检验 F检验的步骤: (2)回归系数的检验 (2)回归系数的检验 计算公式如下: 表1 产品产量与生产费用相关表 从上表可看出,产品产量与生产费用之间存在一定的正相关关系。 例2:以表1为例,对回归模型做回归系数检验 ④由于 =9.72345 ,拒绝 ,表明样本回归系数是显著的,生产费用与产品产量之间确实存在着线性关系,产品产量是影响生产费用的显著因素。 于是, =128.9599/13.26277=9.72345 ③取显著性水平=0.05,并根据自由度=6,查分布表得相应的临界值 。 相关、回归分析习题: 例:已知某地居民人均收入与商品销售额的资料如下: 年份 人均收入(百元/人) x 商品销售额(百万元) y x2 y2 xy 1996 1997 1998 1999 2000 24 30 32 34 38 11 15 14 16 20 576 900 1024 1156 1444 121 225 196 256 400 264 450 448 544 760 合计 158 76 5100 1198 2466 要求根据上述资料: ⑴计算简单相关系数,并进行显著性检验(α=0.05) ⑵求出估计的一元线性回归方程,并解释回归系数的意义 ⑶计算判定系数,并解释其意义 ⑷计算估计标准误差 ⑸检验回归系数的显著性(α=0.05) * * * * * * * * * * * 139 散点图的重要性 下图是新英格兰地区六个州的谋杀率和自杀率(每10万人口)的数据: 州 谋杀率 自杀率 缅因 3.2 14.3 新罕布什尔 2.9 11.3 佛蒙特 4.3 17.8 马萨诸塞 3.6 8.9 罗德岛 4.2 12.3 康涅狄格 5.4 8.6 散点图的重要

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档