- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多重共线性问题概要
问题一:多重共线性 Multi-Collinearity 一、多重共线性的概念 对于模型 Yi=?0+?1X1i+?2X2i+?+?kXki+?i i=1,2,…,n 其基本假设之一是解释变量是互相独立的。 如果存在 c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n 其中: ci不全为0,则称为解释变量间存在完全共线性(perfect multicollinearity)。 注意: 完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。 二、实际经济问题中的多重共线性 一般地,产生多重共线性的主要原因有以下三个方面: (1)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。 (2)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。 (3)样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。 一般经验: 时间序列数据样本:简单线性模型,往往存在多重共线性。 截面数据样本:问题不那么严重,但多重共线性仍然是存在的。 二、多重共线性的后果 2、不完全多重共线性产生的后果 如果模型中存在不完全的多重共线性,可以得到参数的估计值,但是对计量分析可能会产生一系列的影响。 (1)参数估计值的方差增大 (2)对参数区间估计时, 置信区间趋于变大 (3)严重多重共线时,假设检验容易做出错误的判断 (4)当多重共线性严重时,可能造成可决系数R2较高经F检验的参数联合显著性也很高,但对各个参数单独的t检验却可能不显著,甚至可能使估计的回归系数相反,得出完全错误的结论 。 变量的显著性检验失去意义 三、多重共线性的检验 多重共线性检验的任务是: (1)检验多重共线性是否存在; (2)估计多重共线性的范围,即判断哪些变量之间存在共线性。 1、检验多重共线性是否存在 (1)对两个解释变量的模型,采用简单相关系数法 求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。 2、判明存在多重共线性的范围 如果存在多重共线性,需进一步确定究竟由哪些变量引起。 (1) 判定系数检验法 使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟合优度。 如果某一种回归 Xji=?1X1i+?2X2i+??LXLi 的判定系数较大,说明Xj与其他X间存在共线性。 具体可进一步对上述回归方程作F检验: 式中:Rj?2为第j个解释变量对其他解释变量的回归方程的决定系数, 若存在较强的共线性,则Rj?2较大且接近于1,这时(1- Rj?2 )较小,从而Fj的值较大。 因此,给定显著性水平?,计算F值,并与相应的临界值比较,来判定是否存在相关性。 在模型中排除某一个解释变量Xj,估计模型; 如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。 (2)逐步回归法 以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。 根据拟合优度的变化决定新引入的变量是否独立。 如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量; 如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。 (3)方差扩大(膨胀)因子法 经验规则 ●方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。 ●经验表明,方差膨胀因子≥10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。 (4)直观判断法 ①当增加或剔除一个解释变量,或者改变一个观测
文档评论(0)