第五章 线性回归的.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三节 规律性扰动 问题 问题的发现与判断 问题的处理 * 一、问题 除了异常值问题以外,周期性或其它规律性扰动,也会使线性回归模型的误差项偏离零均值的假设。 此外,在横截面数据计量经济分析中,观测对象的性别、年龄、受教育程度等特征差异,也是规律性扰动因素。 这些问题不影响变量关系的总体趋势,但都会对变量关系产生规律性影响,如果不预先加以处理或排除掉,就会导致误差项均值非零的问题出现,影响回归分析的效果。 * 一、问题 例如,变量Y的季度数据中,第一季度总会受到一个季节性因素的影响。 如果我们忽视这种影响,用两变量模型 或多元模型 研究Y的规律,就会遇到误差项非0问题,即 * 二、问题的发现和判断 经济问题背景分析 回归残差序列图分析 两种分析相结合,确定其是否属于规律性扰动 * 三、问题的处理 解决规律性扰动问题的方法之一就是对数据进行统计平滑处理,消除季节性或其他周期性扰动的影响。但这样容易产生两个问题:一是不能区别趋势因素和季节性扰动,不能真正确定所研究变量关系的具体变化轨迹,二是容易导致误差序列自相关问题。因此,它不是克服规律性扰动对线性回归分析影响的好方法 处理规律性扰动的较好方法是引进虚拟变量,有时需要引进多个虚拟变量。 * 例如(1) 在上个例子中,第一季度存在季节性因素的影响,在这个例子中,可使用虚拟变量 把模型改为 或 那么新模型的误差项就不再存在均值非0的问题,回归分析的效果就能得到保证。 * 例如(2) 如果第一季度受到一种季节性因素影响,第三季度受到另一种方向和力度不同的因素的扰动,那么可以引进两个虚拟变量,即 和 将两个虚拟变量引入模型,模型变为 或 * 对于截面数据计量分析的例子 对于截面数据计量分析中,观测对象特征差异导致的规律性扰动,也可以利用虚拟变量加以处理。 如观测对象的性别是一个影响因素,解决的办法就是在模型中引进虚拟变量,即 这个虚拟变量就能解决由于观测对象的性别因素所导致的误差项均值非0问题。 * 注 意 利用虚拟变量解决扰动问题时,引进虚拟变量是有限度的,因为引进一个虚拟变量就意味着要多估计一个参数和损失一个自由度,对回归分析的效果有不利影响。 引进虚拟变量要注意“虚拟变量陷阱”。即属性和类别的个数与虚拟变量个数一致,模型无截距。如上述季节性扰动模型同时引进对应全部4个季节的,按照类似规则定义的四个虚拟变量 那么因为这4个虚拟变量相加等于1,则当这四个变量同时出现在一个模型中,必然导致解释变量严格线性相关,导致模型的崩溃。同样,在考虑性别因素时,若同时引进男性和女性两个虚拟变量也会落入虚拟变量陷阱,所以,引进虚拟变量时,应该谨慎。 * 例题 (考虑性别的一个回归模型) 性别(1为男性、0为女性)m 教龄x 年薪(千美元)y 1 1 23 0 1 19.5 1 2 24 0 2 21 1 3 25 0 3 22 1 4 26.5 0 4 23.1 0 5 25 1 5 28 1 6 29.5 0 6 26 0 7 27.5 1 7 31.5 0 8 29 * 看年薪和教龄之间的散点图 * 不加虚拟变量的回归结果 * 加上虚拟变量后的回归结果 * 第四节 解释变量缺落 问题 发现与判断 问题的处理 * 问题 解释变量缺落,也是引起误差项均值非0问题的常见原因。 所谓解释变量缺落,就是线性回归模型设定的变量关系中,忽略了某些重要的、对被解释变量有趋势性影响的因素。 被忽略的因素对被解释变量的影响,会从误差项中表现出来,导致误差不再是纯粹的随机扰动。 * 例如 若真实的变量关系为 若采用变量关系 * 发现和判断:经济背景分析和残差序列分析 e * 问题的处理 根据找到的原因即缺落的解释变量,针对性的加入该缺落的解释变量,就可以解决问题。 * 第五节 参数变化 问题 发现和判断 问题的解决 * 问题 参数改变是指在考察期间(样本数据范围),变量关系中的参数发生变化,这种问题也可以被理解为模型的稳定性问题。 这时实际上不能用同一个线性回归模型研究变量在整个考察期间的关系。 如果忽视这种模型参数变化,也会导致误差项均值非0问题。 * 问题 以两变量线性关系在考察期【0,T】中的t时刻参数发生变化为例。这种情况下,真实的变量关系可以用【0,t】和【t,T】两个时期中的两个模型分别表示,即 其中, 和 都满足均值为0和线性回归模型的其它假设,且 如果忽略模型参数的变化,用同一变量关系 代表Y和X在整个【0,T】时期的关系,那么在两个时期中的误差项就分别为 * 和 因此,两个时期误差项的均值分别为 和 很显然,除非 和

文档评论(0)

精品报告 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档