第8章多重共线性:变量相关会有什么后果分解.pptxVIP

第8章多重共线性:变量相关会有什么后果分解.pptx

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多重共线性:解释变量相关会有什么后果? 第8章 8.1 多重共线性的性质:完全多重共线性的情形 Y饰品需求,X2价格,X3消费者收入,X4工资。考察如下的需求函数模型: 用表8-1中的数据拟合模型,计算机拒绝估计回归。做价格(X2)对收入(X3)的回归,得如下关系图。 这说明收入与价格完全线性相关,即完全共线性。所有不能对方程(8-1)进行回归。 将收入与价格之间的关系带入(8-1)得 对(8-4)进行回归得: 结论:解释变量之间存在完全相关或者完全多重共线性时,不可能获得所有参数的唯一估计值。 进行经济数据的分析时,变量间常常表现出不完全线性相关,但共线性程度很高的情形,这就是近似、不完全或者高度多重共线性的情形。 8.2 近似或者不完全多重共线性的情形 用表8-1中的数据估计(8-2)得到如下结果: 回归结果显示: (1)模型(8-2)是可估计的。 (2)两次估计的价格系数都是负的,并且差别不大,这和预期的价格系数方向一样。相对而言,(8-7)中价格的t统计量和标准误都略高于(8-8)。 (3)R2略有增加,0.0021。 (4)工资的系数是统计不显著的,符号也有错误。 (5)尽管收入变量不显著,但若假设B2=B3=0,但是根据(4-49)的F检验很容易拒绝原假设。 图8-2 工资 和价格 关系 如何解释这些结果,做价格X2对工资X4的关系图,如下 回归结果为 回归结果显示,价格与工资高度相关,相关系数为-0.9984,即存在近似完全线性关系。 顺便指出:在只有两个解释变量的情况下,相关系数用于共线性程度的度量,多于两个不可以。 (一)数据采集方法问题 (二)模型或从中取样的总体受到约束 (三)模型设定问题 (四)一个过度决定的模型 多重共线性的来源 8.3 多重共线性的理论后果 为什么讨论多重共线性? 1.在近似共线性的情形下,OLS估计量仍然是无偏的。 2.近似共线性并未破坏OLS估计量的最小方差性。 3.即使在总体回归方程中变量 之间不是线性相关的,但在某个样本中, 变量之间可能线性相关。 【 多重共线性问题是一个样本问题 】 8.4 多重共线性的实际后果 (1)OLS估计量的方差和标准误较大。 (2)置信区间变宽。 (3)t值不显著 。 (4)R2 值较高,但t值并不都是统计显著的。 (5)OLS估计量及其标准误对数据的微小变化非常敏感,即它们很不稳定。 (6)回归系数符号有误。 (7)难以评估各个解释变量对回归平方和(ESS)或者R2的贡献。 8.5 多重共线性的诊断 一、多重共线性是一个样本特性,是一个样本现象。 多重共线性是一个程度问题而不是存在与否问题。 多重共线性针对的是解释变量,因此是样本特征,不是总体特征。 二、侦察多重共线性的规则【线索】 (一)R2值高而显著的t比率少 (二)解释变量之间有高度的两两相关 可以计算两两变量之间的相关系数,如果有些相关系数 很高(超过0.8) ,则可能存在较为严重的共线性。但是 这一标准并不十分可靠。 (三)检查偏相关系数 假设3个解释变量X2,X3,X4,X2与X3的相关系数为r23,X2与X4的相关系数为r24,X3与X3的相关系数为r34。假如r23=0.9,说明X2与X3之间高度相关,但是若考察偏相关系数r23,4,即变量X4保持不变的条件下X2与X3之间的相关系数却仅为0.43。那么根据偏相关系数不能说明X2与X3之间的共线性程度很高。 但是偏相关系数不能保证对多重共线性提供一个准确的指南。 (四)辅助回归 做每个解释变量对其他剩余变量的回归并计算相应的R2值。其中的每一个回归都被称为是从属或者辅助回归。 例子 (五)方差膨胀因子 VIF被称为方差膨胀因子。随着R2的增大, 也增大,或者说膨胀了。 注意:诊断多重共线性的方法很多,但是没有哪一种能够彻底诊断多重共线性问题。多重共线性是一个程度问题,是一种样本现象。 已知,样本相关系数 样本相关系数的定义还可以从另一个角度给出。在进行相关分析时,对于所涉及的两个变量X和Y是同等看待的。若设 则样本单相关系数也可定义为两个样本回归系数的乘积的开方,即: r=   r= ± 补充:偏回归系数 设有3个变量X1、X2和X3。3个变量各自以另两个变量为自变量拟合的样本回归方程如下: 利用以上偏回归系数,3个变量之间的偏相关系数可定义如下: 偏回归系数表示:当其他自变量保持不变时,某一自变量变化一个单位而使因变量平均变化的数值。例如,表示X3保持不变时,X2变化一单位而引起的X1平均变化的数值;表示X1保持不变时,X2变化一单位而引起的X3平均变化的数值。 8

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档