异方差的克服和处理.PPT

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
异方差的克服和处理

第六章 异方差 本章结构 第一节 异方差及其影响 第二节 异方差的发现和判断 第三节 异方差的克服和处理 第一节 异方差及其影响 一、异方差及其分类 二、异方差的危害 一、异方差及其分类 两变量和多元线性回归模型第三条假设都要求误差项是同方差的,就是误差项的方差是常数,即 不随i 变化。 如果这条假设不满足,这时候称线性回归模型存在“异方差”或“异方差性” 。 异方差可以用图6.1中对应解释变量不同观测值 和 的误差项,分布密度函数形状不同加以反映。 图6-1 两变量线性回归模型的异方差 图6.1中对应线性回归模型误差项的方差 随着 或i 的增大而增大,这种异方差称为“递增异方差”,是异方差最常见的类型。 但也有方差变化趋势与上述相反的“递减异方差”,或者先增后减或先减后增的其他复杂类型的异方差。 异方差的本质特征是误差项波动幅度的变化。一般来说,随着经济变量数值的增大,波动幅度往往也会相应的增大。 这一方面是因为随机因素的作用有随着经济变量数值的增大而增大的可能,另一方面也可能是随机性因素本身的变化规律作用的结果,此外也可能是观测和统计误差随着经济变量数值的增大而放大的结果。这些因素最终都可能导致线性回归模型误差项异方差问题。 由于数据和随机误差项性质的差异,一般来说异方差问题在截面数据的线性回归分析中更加常见,在时间序列数据中则相对要少一些。 值得注意的是,当线性回归模型存在解释变量缺落、函数形式不准和参数改变等模型定式误差问题时也会表现出与异方差相似的特征,容易与由误差项变动幅度变化引起的真正异方差混淆。 例如两个变量有真实关系 其中误差项满足线性回归模型的所有假设。 但如果误以为Y 和X 之间的关系是: 并认为 ,那么 若记 ,则 因此 是 的函数,即模型表现出异方差性。 这种异方差本质上与误差项波动变化的异方差是不同的,是模型误差项均值非零的系统偏差导致的,我们称这种异方差为“假性的”。 二、异方差的危害 异方差对以最小二乘估计为核心的线性回归分析的作用和价值有严重影响。 异方差虽然不会影响最小二乘估计的无偏性,但最小二乘估计量方差的估计和最小方差性,都是以模型误差项同方差假设为基础的。 当线性回归模型的误差项存在异方差问题时,普通最小二乘估计不再是方差最小的估计,某种形式的加权最小二乘估计才是最小方差的有效估计。 最小二乘估计量方差确定的困难,则会对以参数估计量的统计性质和分布特征为基础的统计推断等分析,以及区间估计和区间预测等造成严重影响,使这些统计推断失去基础。 第二节 异方差的发现和判断 一、 残差序列图分析 二、 戈德菲尔德-夸特检验 三、 戈里瑟检验 一、残差序列分析 利用模型回归残差序列的分布形态进行分析,是发现和判断异方差问题的基本方法。 以i 或 为横轴,残差e为纵轴,作残差序列的分布图形,那么模型不存在异方差问题时,回归残差应该均匀地分布在横轴上下的一定范围内,如图6.2(a)。 如果残差序列的分布形态如图6.2(b), 的分布有随着 的增大而越分散的趋势,那么应该怀疑存在异方差性,而且是递增异方差。 图6.2 异方差的发现和识别 (a) (b) 如果残差序列分布形态如图6.2(c)或(d),应该考虑递减异方差或复杂异方差的可能性。 如果残差序列分布形态如图6.2(e)或(f),应该考虑假性异方差,也就是参数变化或函数设定偏差的可能性等。 图6.2 异方差的发现和识别 (c) (d) 图6.2 异方差的发现和识别 (e) (f) 残差序列图分析虽然直观简便,但有时无法作出明确的判断,特别是残差分布形态不很典型时很难得出结论。 为此提出了一些更严密的判断方法,戈德菲尔德-夸特(Goldfeld-Quandt)检验和戈里瑟(Glejser)检验是其中比较常见的两种。 二、戈德菲尔德-夸特检验 这种方法适合检验样本容量较大的线性回归模型的递增或递减型异方差性。 我们以递增异方差为例说明戈-夸检验的思路和方法。 模型存在递增异方差时会在回归残差序列的分布中反映出来,表现为其发散程度随某个解释变量的增大而不断增大。 如果将样本按 排序,那么对应较小 的回归残差,平均将明显小于对应较大的 的回归残差。 把按 排序的观测样本分成数目相同的两部分,并为了加强显著性起见,去掉中间占样本总数大约1/4到1/3的部分样本,同时注意使剩余样

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档