第九讲 多重共线性与随机解释变量.ppt

  1. 1、本文档共76页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九讲 多重共线性与随机解释变量

1、工具变量的选取 工具变量:在模型估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机解释变量。 选择为工具变量的变量必须满足以下条件: (1)与所替代的随机解释变量高度相关; (2)与随机误差项不相关; (3)与模型中其它解释变量不相关,以避免出现多重共线性。 2、工具变量的应用 对于多元线性模型 Yi=?0+?1X1i+?2X2i+?+?kXki+?i ( i=1,2,…,n) 用普通最小二乘法估计模型,最后归结为求解一个关于参数估计量的正规方程组: (1) 该正规方程组是用每个解释变量分别乘以模型的两边,并对所有样本点求和: (2) 然后再对方程的两边求期望: (3) 并利用下列条件得到的: 如果X2为随机变量,且与随机误差项相关,将导致从上述(3)式的第3个方程无法得到上述(1)式的第3个方程,也就无法求得参数的无偏估计量。 如果按照工具变量的选择条件选择Z作为X2的工具变量。在应该用X2乘方程两边时,不用X2,而用Z,将使上述(2)式变为: (4) 请注意,(4)式与(2)式的区别仅仅在于第3个方程两边的“乘数变量”,原模型中的X2并没有改变,包括第3个方程。 求解该方程组即可得到关于原模型参数的工具变量法估计量。 (5) 对于矩阵形式: Y=XB+N 通常,对于没有选择另外的变量作为工具变量的解释变量,可以认为用自身作为工具变量。于是Z被称为工具变量矩阵。 其中利用了工具变量与随机误差项不相关。 3、工具变量法估计量是无偏估计量 4、几点注解 工具变量并没有替代模型中的解释变量,只是在估计过程中作为“工具”被使用。 如果模型中有两个以上的随机解释变量与随机误差项相关,就必须找到两个以上的工具变量。但是,一旦工具变量选定,它们在估计过程被使用的次序不影响估计结果。为什么? OLS可以看作工具变量法的一种特殊情况。为什么? 五、案例一:服装市场需求函数□ 1、建立模型 根据理论和经验分析,影响居民服装类支出Y的主要因素有:可支配收入X、居民流动资产拥有量K、服装价格指数P1、物价总指数P0。 已知某地区的有关资料,根据散点图判断,建立线性服装消费支出模型: Y=?0+?1X+?2K+?3P1+?4P0+? 2、样本数据 由于R2较大且接近于1,而且 F=638.4,大于临界值:F 0.05(4,5)=15.19,故认为服装支出与上述解释变量间总体线性关系显著。 但由于变量K的参数估计值的t检验值较小(未能通过检验),故解释变量间存在多重共线性。 3、估计模型 (1)用OLS法估计上述模型: (2)检验简单相关系数 不难看出,各解释变量间存在高度相关性,其中尤其以P1和P0间的相关系数为最高。 (3)找出最简单的回归形式 可见,应选①为初始的回归模型。 (4)逐步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。 5、结论 回归方程以Y=f(X, P1, P0)为最优: Y=-12.45+0.10X-0.19P1 +0.31P0 当模型存在共线性,将某个共线性变量去掉,剩余变量的参数估计结果将发生变化,而且经济含义有可能发生变化; 严格地说,实际模型由于总存在一定程度的共线性,所以每个参数估计量并不真正反映对应变量与被解释变量之间的结构关系。 模型选择准则 1、R2准则 2、调整的R2准则 3、赤池信息(AIC)准则 4、施瓦茨信息(SIC)准则 R2准则 调整的R2准则 准则:该值越大越好! 注意:被解释变量相同才能比较! 赤池信息(AIC)准则 准则:该值越小越好! 注意:被解释变量相同才能比较! 可用于比较一模型样本内或样本外的预测表现! 施瓦茨信息(SIC)准则 准则:该值越小越好! 注意:被解释变量相同才能比较! 可用于比较一模型样本内或样本外的预测表现! Cp统计量 其中: ----样本量; ----模型中自变量个数; ----1+全回归模型中个数(); ----有个自变量的回归模型的决定系数; ----全回归模型的决定系数。 如果一个模型和真实模型之间只有随机差异, 的平均值为 ,而且,数据拟合的很好的回归模型其 值应小于 。因此,在用这个统计量对不同的回归模型进行评估时,目的往往是为了找到一个模型使其表达式 值为负。 随机解释变量 Random Independent

文档评论(0)

xy88118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档