[经济学]优秀统计学 之一元线性回归模型.pptVIP

[经济学]优秀统计学 之一元线性回归模型.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[经济学]优秀统计学 之一元线性回归模型

一元线性回归模型 一元线性回归 涉及一个自变量的回归 因变量y与自变量x之间为线性关系 被预测或被解释的变量称为因变量(dependent variable),用y表示 用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x表示 因变量与自变量之间的关系用一个线性方程来表示 一元线性回归模型 描述因变量 y 如何依赖于自变量 x 和误差项? 的方程称为回归模型 一元线性回归模型可表示为 y = ?0 + ?1 x + e(总体回归模型) y 是 x 的线性函数(部分)加上误差项 线性部分反映了由于 x 的变化而引起的 y 的变化 误差项 ? 是随机变量 反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响 是不能由 x 和 y 之间的线性关系所解释的变异性 ?0 和 ?1 称为模型的参数 样本回归函数 对于实际的经济问题,通常总体的情况是未知的,无法掌握所有单位的数值,总体回归函数实际上是未知的,因此我们只能从总体中抽取的样本数据进行观测,同时总体的参数也是未知的,必须用样本回归的参数来替代,这样我们有样本回归函数: 其中 是与 相对应的估计值, 和 分别是样本回归函数的估计参数。 样本回归函数与总体回归函数的区别 1、总体回归函数虽然是未知的,但它是确定的;而从总体中每次抽样都能获得一个样本,就都能拟合一条样本回归线,所以样本回归线是随抽样波动而变化的,可以有很多条。因此样本回归线不等于总体回归线,最多只是未知总体回归线的近似表示。 2、总体回归函数的参数是确定的常数;而样本回归线的参数是随抽样而变化的随机变量。 3、总体回归函数中的误差项是不可直接观测的,而样本回归函数的误差项是可以直接计算得出。 回归分析的目的 利用样本回归函数去估计总体回归函数。由于样本对总体总是存在代表性误差,样本回归函数总会过高或者过低估计总体回归函数。我们研究的目的是,需要寻求一种规则和方法,使得样本回归函数中的参数能够“尽可能地接近”总体回归函数中的参数。 一元线性回归模型 (基本假定) 误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于一个给定的 x 值,y 的期望值为E (y) =? 0+ ? 1 x 对于所有的 x 值,ε的方差σ2 都相同 误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N( 0 ,σ2 ) 无自相关假定 误差项与自变量不相关 参数的最小二乘估计 最小二乘法的思路 为了精确地描述Y与X之间的关系,必须使用这两个变量的每一对观察值(n组观察值),才不至于以点概面(做到全面)。 Y与X之间是否是直线关系(用协方差或相关系数判断)?若是,可用一条直线描述它们之间的关系。 在Y与X的散点图上画出直线的方法很多。 找出一条能够最好地描述Y与X(代表所有点)之间的直线。问题是:怎样算“最好”? 最好指的是找一条直线使得所有这些点到该直线的纵向距离的和(平方和)最小。 最小二乘法的思路 最小二乘法的思路 纵向距离是度量实际值与拟合值是否相符的有效手段 点到直线的距离——点到直线的垂直线的长度。 横向距离——点沿(平行)X轴方向到直线的距离。 纵向距离——点沿(平行)Y轴方向到直线的距离。也就是实际观察点的Y坐标减去根据直线方程计算出来的Y的拟合值。 实际值-拟合值=残差(剩余) 最小二乘法的思路 纵向距离是Y的实际值与拟合值之差,差异大拟合不好,差异小拟合好,所以称为残差、拟合误差或剩余。 将所有纵向距离平方后相加,即得误差平方和,“最好”直线就是使误差平方和最小的直线。拟合直线在总体上最接近实际观测点。 于是可以运用求极值的原理,将求最好拟合直线问题转换为求误差平方和最小的问题。 最小二乘估计 数学形式 最小二乘估计 (图示) 最小二乘法 ( 和 的计算公式) 回归直线的拟合优度 变差 因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面 由于自变量 x 的取值不同造成的 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示 变差的分解 (图示) 离差平方和的分解 (三个平方和的关系) 离差平方和的分解 (三个平方和的意义) 总平方和(SST) 反映因变量的 n 个观察值与其均值的总离差 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和 残差平方和(SSE) 反映除 x

文档评论(0)

ctuorn0371 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档