第8章 多重共线性:解释变量相关会有什么后果1126.ppt

第8章 多重共线性:解释变量相关会有什么后果1126.ppt

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 5、方差膨胀因子 其中,R22表示解释变量之间辅助回归方程的样本决定系数。 * 四、多重共线性评价:必定不好吗? 根据不同的研究目地加以选择: 目的一:预测因变量的均值,即使存在多重共线性,只要模型中的共线性一直存在下去,并且具有较高的解释能力(判定系数较大) 目的二:除了要求进行预测,还要估计模型参数。则严重的共线性存在就不好 目的三:估计一组系数(如估计两个系数的和或差,例如,解释行业生产规模效应),存在共线性也没有问题。 五、克服多重共线性的方法(8.8) 1、排除引起共线性的变量 找出引起多重共线性的解释变量,将它排除出去。 (补充)逐步回归法: 以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计 根据拟合优度的变化决定新引入的变量是否独立 若拟合优度变化显著,则说明新引入的变量是一个独立解释变量; 若拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系 两难:共线性;设定误差 2、获取额外的数据或新的样本 3、重新考虑模型 4、参数的先验信息 5、变量变换 增加样本可改善共线性问题,但有困难 五、克服多重共线性的方法 既然先验信息难以获得,且其准确性易遭质疑 名义变量变为实际变量、采用变量的差分形式 本章重点复习: 8.1~8.12; 8.14~8.18、8.20 第二部分 实践中的回归分析 基本假定违背:不满足基本假定的情况。 (1)模型设定有偏误;所选模型是正确设定的 (2)解释变量之间存在多重共线性; (3)随机误差项序列存在异方差性; (4)随机误差项序列存在序列相关性。 所选模型是正确设定的 解释变量之间不存在完全线性关系 误差项方差为常数 误差项之间不相关 基本假定 基本假定 基本假定 基本假定 第八章 多重共线性 Multi-Collinearity 一、多重共线性的性质 二、多重共线性的实际后果 三、多重共线性的诊断 四、克服多重共线性的方法 五、案例 一、多重共线性的性质(8.1-8.2) 1、完全多重共线性 2、近似(不完全)多重共线性 对于模型 Yi=B0+B1X1i+B2X2i+…+BkXki+μi i=1,2,…,n 其基本假设之一是解释变量是互相独立的。 如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。 完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。 如果存在c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n 其中: ci不全为0 如果存在c1X1i+c2X2i+…+ckXki+vi=0 i=1,2,…,n 其中ci不全为0,vi为随机误差项 1、解释变量间存在完全共线性(perfect multicollinearity) 2、近似(不完全、高度)共线性(near/imperfect/high multicollinearity) 不可能获得所有参数的唯一估计值及根据样本进行任何统计推断。 OLS估计量仍是最优线性无偏估计量 * 完全多重共线性和不完全多重共线性:举例 完全多重共线性模型: X3=300-2X2 R2=1, 且相关系数r=1 (模型8-3) 两个变量之间存在精确的线性关系 不完全多重共线性模型 X4=299.92-2.0055X2+e (模型8-9) R2=0.9770, 且相关系数r=-0.9884 两个变量之间存在不精确的线性关系,即存在近似的线性关系. 注意: 除非是完全共线性,多重共线性并不意味着任何基本假设的违背; 因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。 问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息。 OLS估计量仍是最优线性无偏估计量( BLUE). (即不违背前面第四章所学过的任何基本假定) 但这不代表任何一个样本估计值的性质(如方差最小等) 多重共线性本质上是一个样本(回归)现象。即使在总体回归方程中解释变量X之间不是线性相关的,但在某个样本中,解释变量X之间可能线性相关. 存在不完全多重共线性时 参数估计值的方差与标准差变大 容易使通过样本计算的t值小于临界值, 误导作出参数为0的推断,最终得出t检验 结果

文档评论(0)

阿宝 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档