- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 多重共线性 上海立信会计学院 一、多重共线性的性质 1.完全多重共线性的情形 例子:下表(表8-1)中给出了产品需求(Y)、价格(X2)以及消费者收入的两组数据,X3,X4。为了区别,前者称为收入,后者称为工资。 四、多重共线性的诊断 需要强调的是: 1.多重共线性是一个程度问题而不是存在与否问题。 2.由于多重共线性针对的是解释变量是非随机的情形,因而它是一个样本特征,而不是总体特征。 诊断多重共线性的方法(例子:美国新轿车的需求,表8-5) 1.R2较高但t值统计显著的不多。 2.解释变量两两高度相关。如果有两个变量之间的相关系数很高,比如说超过了0.8,则可能存在较为严重的共线性。 3.检查偏相关系数。但用偏相关系数代替简单的相关系数也不能提供一个检验多重共线性的准确标准。 * * 本章内容主要包括: 1.多种共线性的性质 2.多重共线性的理论后果是什么? 3.多重共线性的实际后果是什么? 4.实践中如何诊断多重共线性? 5.消除多重共线性的补救措施有哪些? 表1 对产品的需求 分别估计一下两个模型。依据理论,预计A2和B2为负,而A3和B3为正。 但当用上表数据拟合回归式(1)时,计算机“拒绝”估计模型。为什么呢? 作价格对收入的关系图: 收入与价格的散点图 如果做X3对X2回归,得到如下结果: 结果显示,收入变量和价格变量完全线性相关,即完全共线性。如果把方程(3)代入方程(1)中,得到: 从方程(4)可以看出,这并不是多元回归,而是Y对X2的一元回归。虽然可以估计出C1和C2的值,但根据这些变量却无法求的原始参数A1,A2,和A3的估计值。 利用表1数据对方程4回归得到如下结果: , 。但无法根据这两个值推出3个未知变量 、 和 的值。 总结:当解释变量之间完全共线性时,不可能得到所有参数的唯一估计值,因而也就不能根据样本进行任何统计推断。 2.接近或者不完全多重共线性的情形 定义:共线性程度很高,但不是完全共线性的情况就称为接近,或不完全,或高度多重共线性。 注意:从现在起,我们所说的多重共线性是指不完全多重共线性。 另一个例子,用工资作为收入变量进行回归,结果如下: 分析这个结果,我们有如下结论: (a)虽然不能估计包含收入的模型(1),但能估计回归方程(6),尽管两种收入变量之间的差别很小。 (b)与预期相同,方程(5)中和方程(6)中的价格系数都是负的,并且两者之间的差异不大。每一价格系数都显著不为零。 (c)方程(5)中的R2值为0.98,而方程(6)中的R2值为0.98。可以证明R2的增值是统计不显著的。 (d)收入(工资)的系数是统计不显著的,但更重要的是它的符号是错误的。 (e)尽管收入变量是不显著的,但若假设B2=B3=0,则根据F检验很容易拒绝零假设。换句话说,价格和工资同时对商品的需求有显著影响。 如何解释这些奇怪的现象? 首先做价格 对工资 的关系图。然后做价格和工资的回归,结果如下: 价格和工资的散点图 图形和回归结果表明,尽管价格和工资并不是完全线性关系,但两个变量之间却存在高度相关性,相关系数为-0.99(即 的负平方根) 二、多重共线性的理论后果 首先,在古典线性回归模型(CLRM)的假定下,即使存在变量之间的多重共线性,OLS估计量仍然是最优线性无偏估计量,即使多元回归方程的一个或多个偏回归系数是统计不显著的。 其次,多重共线性通常是一个样本特有的现象。我们之所以依然讨论多重共线性,是因为: 1.在接近共线性的情况下,尽管OLS估计量仍然是无偏的,但无偏性是一个重复抽样性质,不是单个样本估计值的性质。 2.接近共线性也并没有破坏OLS估计量的最小方差性,但这并不意味着任何一个样本的OLS估计量的方差会很小。从方程(6)可以看出,与收入系数的估计值相比,样本方差很大,以至于计算的t值仅有-0.797。因而接受假设。 3.即使总体中的自变量X之间不是线性相关的,但无法保证某一样本中的自变量X之间也不线性相关。 三、多重共线性的实际后果 在接近或者高度多重共线性的情况下,可能遇到如下一个或多个后果: 1.OLS估计量的方差和标准误较大。从而OLS估计量的精确度下降。 2.置信度变宽 3.R2值很高,总体显著性检验显著,但多数t值不显著 在回归方程(6)中,检验假设:真实的B3=0,计算出t值,并于临界值比较。但是,当存在高度共线性时,由于估计的标准误急剧增加,因而使得t值变小。这种情况下,很自然地接受零假设。 4.OLS估计量及其标准误对数据的微小变化非常敏感 5.回归系数
文档评论(0)