第10讲多重共线性.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第10讲多重共线性

第十讲 多重共线性(Multicollinearity)一、多重共线性及其产生的原因二、多重共线性的影响三、多重共线性的检验四、多重共线性的克服和处理第一节 多重共线性及其产生的原因一、多重共线性1.定义 多元线性回归模型要求解释变量之间不存在线性关系,包括严格的线性关系和高度的近似线性关系。 但事实上由于模型设定和数据等各方面的问题,模型的解释变量之间很可能存在某种程度的线性关系。这时候称多元线性回归模型存在多重共线性(Multicollinearity)问题。 2.分类如果多元线性回归模型中,若变量之间存在如下线性关系: c1x1i+c2x2i+…+ckxki=0i=1,2,…,n 其中: ci不全为0则称解释变量之间存在“完全共线性”,也称为“严格的多重共线性”(perfect multicollinearity)。 若解释变量之间如下关系: c1x1i+c2x2i+…+ckxki+vi=0i=1,2,…,n 其中: ci不全为0,vi为随机误差项这种情况被称为“近似共线性”(approximate multicollinearity)或“交互相关性”(intercorrelated)。 完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。需要说明的是,解释变量之间不存在线性关系,并并不意味着不存在非线性关系,当解释变量之间存在非线性关系时,并不违反无多重共线性假定。二、多重共线性产生的原因1.经济变量之间的内在联系(根本原因)时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。2.滞后变量的引入例如,消费=f(当期收入, 前期收入),显然,两期收入间有较强的线性相关性。3.样本容量的限制假设只有两个自变量x1与x2,当n=2时,两点总能连成一条直线,即使性质上原本并不存在线性关系的变量x1与x2,由于样本含量问题产生了共线性。如果研究的自变量个数大于2,设为x1,x2,...,xk,虽然各自变量之间没有线性关系,但如果样本容量n小于模型中自变量的个数k,就可能导致多元共线性问题。4.特殊观测值的存在20世纪80年代后期,人们开始关注特殊观测值对多重共线性的影响:(1)导致或加剧多重共线性 (2)掩盖存在着的多重共线性(a)中特殊观测值掩盖了原本存在的共线性;(b)中则因为特殊观测值得出现而导致了解释变量之间存在共线性。这样的特殊观测值称谓多重共线性强影响观测值。第二节 多重共线性的影响一、完全共线性条件下无法得到参数估计量对于回归模型:OLS估计量为:如果自变量之间存在完全共线性,则有: ,也就是说 的逆阵不存在。因此无法利用最小二乘法估计偏回归系数。例:对离差形式的二元回归模型如果两个解释变量完全相关,如x2= ?x1,则:这时,只能确定综合参数?1+??2的估计值:二、近似共线性条件下OLS估计量方差会很大假定要回归的模型为:在近似共线性的条件下,可以得到OLS估计量,但由于估计量的方差为:r12为x1、x2的相关系数 称为方差膨胀因子(Variance Inflating Factor),记成VIF。VIF表明:OLS估计量的方差随着多重共线性的出现而“膨胀”起来。当x1、x2高度相关时(即r12→1),VIF→+∞;OLS估计量的方差将成倍增长,直至趋于无穷大。 三、参数估计量不具有合理的经济含义如果模型中两个解释变量具有线性相关性,例如x2= ?x1 ,这时,x1和x2前的参数?1、?2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。?1、?2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如?1本来应该是正的,结果恰是负的。一般情况下,在多元线性回归模型的估计中,如果出现参数估计值的经济意义明显不合理的情况,应该首先怀疑是否存在多重共线性。四、变量的显著性检验失去意义存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界值, 误导作出参数为0的推断可能将重要的解释变量排除在模型之外五、模型的预测功能失效 变大的方差容易使区间预测的“区间”变大,使预测失去意义;其次,由于参数估计量的方差变大,因而参数估计对样本的变化反应十分敏感,即当样本观测值稍有变化时,模型参数就有很大差异,致使模型难以应用。值得注意的是:多重共线性不改变参数估计量的无偏性。事实上,对严重多重共线性,参数估计量仍为最优的估计(BLUE)第三节 多重共线性的检验多重共线性检验的任务在于:检验多重共线性是否存在;估计多重共线性的范围,即判定哪些变量之间

文档评论(0)

ddf55855 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档