第六讲-第9章 回归-2011.ppt

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章 回归 统计学上采用回归分析 (regression analysis)研究呈因果关系的相关变量间的关系。表示原因的变量称为自变量,表示结果的变量称为依变量。 研究“一因一果”,即一个自变量与一个依变量的回归分析称为一元回归分析; 研究“多因一果”,即多个自变量与一个依变量的回归分析称为多重回归分析。 一元回归分析又分为直线回归分析与曲线回归分析两种;多重回归分析又分为多重线性回归分析与多重非线性回归分析两种。 第一节 直线回归 regression analysis 一、直线回归方程的建立 对于两个相关变量,一个变量用x表示,另一个变量用y表示,如果通过试验或调查获得两个变量的n对观测值: (x1,y1),(x2,y2),……,(xn,yn) 在x、y直角坐标平面上可以作出无数条直线,我们把所有直线中最接近散点图中全部散点的直线用来表示x与y的直线关系,这条直线称为回归直线。 其中,a是α的估计值,b是β的估计值。 a、b应使回归估计值 与实际观测值y的偏差平方和最小,即: 整理得关于a、b的正规方程组: 回归方程的基本性质: 如果将(9-4)式代入(9-2)式,得到回归方程的另一种形式(中心化形式): 【例9.1】在四川白鹅的生产性能研究中,得到如下一组关于雏鹅重(g)与70日龄重(g)的数据,试建立70日龄重(y)与雏鹅重(x)的直线回归方程。 表9-1 四川白鹅雏鹅重与70日龄重测定结果 (单位:g) 1、作散点图 以雏鹅重(x)为横坐标,70日龄重(y)为纵坐标作散点图。 2、计算回归截距a,回归系数b,建立直线回归方程 首先根据实际观测值计算出下列数据: 进而计算出b、a: 3、直线回归的偏离度估计 偏差平方和 的大小表示了实测点与回归直线偏离的程度,因而偏差平方和又称为离回归平方和。统计学已经证明:在直线回归分析中离回归平方和的自由度为n-2。于是可求得离回归均方为: 离回归均方是模型(9-1)中σ2的估计值。 离回归均方的平方根叫离回归标准误,记为 ,即 (9-6) 离回归标准误Syx的大小表示了回归直线与实测点偏差的程度,即回归估测值 与 实 际观测值y偏差的程度,于是我们把离回归标准误Syx用来表示回归方程的偏离度。 可以证明: (9-7) 利用(9-7)式先计算出 ,然后再代入(9-6)式求Syx 。 二、直线回归的显著性检验 若x和y变量间并不存在直线关系, 但由n对观测值(xi,yi)也可以根据上面介绍的方法求得一个回归方程 =a+bx。 显然,这样的回归方程所反应的两个变量间的直线关系是不真实的。 如何判断直线回归方程所反应的两个变量间的直线关系的真实性呢?这取决于变量x与y间是否存在直线关系。我们先探讨依变量y的变异,然后再作出统计推断。 1、直线回归的变异来源 图 的分解图 从图中看到: 上式两端平方,然后对所有的n点求和,则有 反映了y的总变异程度,称为y的总平方和,记为SSy; 反映了由于y与x间存在直线关系所引起的y的变异程度,称为回归平方和,记为SSR;

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档