网站大量收购独家精品文档,联系QQ:2885784924

第七篇 多重共线性3.ppt

  1. 1、本文档共89页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 多重共线性 一、多重共线性的概念 二、产生多重共线性的原因 三、多重共线性的结果 四、多重共线性的检验 五、多重共线性的修正方法 引例1 设因变量y(消费) 与自变量x1(月收入+奖金)与x2(月收入)具有表所示的观察值.以模型 拟合表中数据。 解(1) 用ols法得回归方程 ?=10.9437-2.0151x1+3.6482x2 t (-0.759) (1.379) P (0.472) (0.21) R2=0.9878 X1与x2的相关系数 r1.2=0.9997 上述结果表明,在整体上方程显著,拟合度很高,方程能很好地拟合数据,说明至少有一个变量对Y的影响是显著的; 但从系数的检验看,两个系数都不显著,这又说明x1与x2的影响似乎都很小,均不显著。 从经典回归的观点看,这两个结论是相互矛盾的 2)分别做y 对x1 与x2 的回归 ?=9.4092+1.6449x1 R2=0.9845 ?=10. 0569+1.6409x2 R2=0.9868 方程(2)与(3)的拟合优度都很大,回归系数不但都非常显著,而且x1的系数在(2)中与在(1)中的正负号相反。这说明x1与x2对y 都有重要的影响。 为何出现模型(1)中分析结果? 引例2 三次产业对财政收入的影响研究 因变量:y 某地财政收入 自变量:该地第一、二、三产业增加值(x1、X2、x3) 方程整体非常显著,表明三次产业至少有一个对财政收入的解释能力非常强, 但系数检验每个解释变量均不显著,且第一产业的影响是负数,与理论矛盾 原因可能存在严重共线性。 一、多重共线性的概念 多重共线性:在多元线性回归模型中,解释变量之间存在着完全的线性关系或接近的线性关系 例如: 实例: 以某一行业的企业为样本建立企业生产函数模型,以产出量为被解释变量,选择资本、劳动、技术等投入要素为解释变量。这些投入要素的数量往往与产出量成正比,产出量高的企业,投入的各种因素比较多,这就使得投入要素之间出现线性相关性。 一般来说,由于经济数据的限制使得模型设计不当,导致模型设计中解释变量间存在普遍的相关关系。 问题 请问: 产生多重共线性的原因是什么? 如果模型存在多重共线性,会有哪些后果? 二. 产生多重共线性的原因 1.经济变量在时间上有共同变动的趋势。如在经济上升时期,收入、消费、就业率等都增长,当经济收缩期,收入、消费、就业率等又都下降。当这些变量同时进入模型后就会带来多重共线性问题. 2.某一变量及其滞后变量同时作为解释变量。例如,消费=f(当期收入, 前期收入). 显然,两期收入间有较强的线性相关性。 3. 样本资料的限制.由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。 多重共线性最常出现在时间序列数据模型中,但也经常出现在截面数据模型中。 例如考察上述这几个自变量对因变量(如GDP)的影响,建立如下回归方程: 三. 多重共线性的结果 1.完全多重共线性:普通最小二乘法失效, 估计量的方差无限大 2.近似多重共线性:估计量的方差很大,OLS参数估计量非有效。 3.参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性,例如 X2= ?X1 , 这时,X1和X2前的参数?1、?2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。 ?1、?2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如?1本来应该是正的,结果恰是负的。 如:对二元线性回归模型 则该二元线性回归模型就会退化为一元线性回归模型 4.变量的显著性检验失去意义。估计量的方差很大,相应标准差增大,进行t检验时,接受零假设的可能性增大。 5、模型的预测功能失效。变大的方差容易使区间预测的“区间”变大,使预测失去意义。 四、 多重共线性的检验 1.不显著系数法 2. 参数估计值符号判断法 3.自变量的相关系数矩阵法 4.多元决定系数值诊断法 四、 多重共线性的检验 1.不显著系数法 (1) 如果拟合度R2很大(0.8),但模型中全部或大多数参数估计值却不显著,此时自变量之间可能存在较严重多重共线性. 【例题7.3】 城市的死亡率受到诸多社会经济变量的影响,现选择如下几个变量进行研究, MORT:每100000人口的死亡率, INCC:人均收入, POV:贫困家庭比例, EDU1:完成中学教育的人口比例, EDU2:受过大学教育的人口比例, ALCC:人均酒精消费, TOBC:人均香烟

文档评论(0)

189****6140 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档