[].多重共线性问题fixed.ppt

下载文档

30
0
约2.61千字
约 32页
2015-08-15 发布于湖北
举报
版权申诉
保障服务

[].多重共线性问题fixed.ppt

1、本文档共32页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

[].多重共线性问题fixed.ppt

多重共线性一、多重共线性的性质二、多重共线性的后果三、多重共线性的检验四、多重共线性的补救一、多重共线性的性质 1、参数仍然可以估计，而且模型并不违反经典线性回归模型的任何假定。因此，OLS估计量仍然是BLUE。 2、多重共线性本质上是一种样本现象。 1、普通最小二乘估计量的方差会增大，故难以作出精确的估计。方差膨胀因子(variance inflation factor, VIF) 2、由于估计量方差增大，从而标准误增大，容易使t值小于临界值，降低回归系数的显著性。从而，常常错误地认为某个解释变量对因变量没有任何影响。3、同样的道理，置信区间变宽了。4、虽然一个或多个系数的t值倾向于统计上不显著，但是总的拟和优度（判定系数）仍可能非常之高。5、OLS估计量及其标准误对数据的微小变化非常敏感，也即趋于不稳定。（模拟验证）6、根据回归结果，难以评估各个解释变量对因变量的独立影响。（为什么？）多重共线性产生的原因主要有： 1、经济变量的内在联系。这是产生多重共线性的根本原因； 2、解释变量中含有滞后变量； 3、时间序列经济变量变化趋势的共向性； 4、样本容量过少。一点忠告严格地说，回归模型中的解释变量由于总会存在一定程度的线性关系，所以每个回归系数的估计量并不能够真正反映出解释变量对因变量的影响。然而，这就是生活！ * 不完全（近似）的多重共线性如果解释变量之间满足近似线性关系：那么称：解释变量之间存在着不完全（近似）的多重共线性。二、多重共线性的后果（一）完全多重共线性下的后果（二）不完全多重共线性的理论后果在不完全多重共线性下，不管共线性的程度如何，最小二乘估计量在所有线性无偏估计量中仍然具有最小方差。但是，最小方差并不意味着方差一定就小。稍后即明。即使在总体中，解释变量之间没有线性关系，但在具体的样本数据中仍然可能存在线性关系，以至于我们难以分开它们对因变量的各自独立的影响。对于同样的模型设定，考虑两种情况，第一种情况是解释变量的样本值之间存在相当强的线性关系，第二种情况是这种线性关系程度比较低。那么，在第一种情况下得到的OLS估计量的方差一般会大于在第二种情况下得到的OLS估计量的方差。由于系数估计量的方差增大，因此，常常出现系数估计值的大小、符号和关系很反常的现象。经验上，在多元回归模型的估计中，如果出现系数估计值的经济意义明显不合理的情况，应该首先怀疑是否存在多重共线性。（三）不完全多重共线性的实际后果 1、多重共线性是一个程度问题而不是有无的问题，有意义的区分在于区分它的不同程度和不同后果，而不在于区分有无。 2、多重共线性是一种样本特征，而非总体特征。 3、由于大多数社会科学中收集得到的数据都是非试验性数据，因此没有侦破或识别其强度的唯一方法。我们所探讨的只是一些经验规则，不可能放之四海而皆准。三、多重共线性的检验一点忠告：二、解释变量两两高度相关。如果某个相关系数很高，比如说高于0.8，则可能存在严重的共线性。注：该方法的局限性主要在于相关系数只能测度两个解释变量之间线性相关的程度，而不能测度三个或更多解释变量之间的线性相关程度。另外要特别注意的是，有时候两两相关系数都较低，但三个以上的变量间却有高度共线性。三、辅助回归（判定系数测度法）四、逐步回归法五、方差膨胀因子判断法四、多重共线性的补救措施多重共线性的主要后果在于使得参数估计量的方差变大，从而降低估计精度。因此，补救严重共线性的目的都是为了能够降低估计方差，提高估计精度。一、增加样本容量建模时样本数据太少，易产生多重共线性。在保持模型结构不变的前提下，如果增加新的样本数据或更换样本数据，共线性问题也许会减弱。（这或许是最好的办法，但实际上难以实现，特别是在时序回归分析中。）二、从模型中删掉一个变量如果共线性问题很严重，最简单的解决办法就是去掉一个或者多个共线性的变量。但是，如果去掉的变量与因变量相关的程度很高，那么这种做法将会导致严重的模型设定偏误，使得系数估计量有严重偏误。如果目的是为了牺牲无偏性去获得估计的高精度，那么去掉共线性强的变量是最简单易行的方法。三、利用先验信息四、数据结合（先验信息法的变种）如果时间序列回归模型存在多重共线性，可考虑用截面数据回归来获得先验信息。例如：某种商品的需求函数：如果拥有大量该商品消费的截面数据，那么可以做消费量对收入的截面数据回归，以此获得收入系数的估计值。由于同一时期价格的变化还不很大，因此可以很可靠地估计收入系数。显然，该模型消除了共线性问题，但是该办法无形中假定了收入系数的截面估计和时间序列估计是一样的。值得注意的是，时间发展变化过程中需求与收入的依赖关系是否完全与时间保持不变时