寻找工具变量指南.docx

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
寻找工具变量2013年08月21日01:17:588月20日下午,左老师给我们讲了工具变量(instrumental variable)简称IV,但由于时间关系,没有办法详细展开,主页菌帮大家再整理一下重点和思路。左老师说,一个好的工具变量可以直接MIT博士毕业,可见找工具变量是一件有挑战性的事情。在我看来,找工具变量是一项有趣的智力活动,除了需要一个人有经济学的素养和逻辑,还需要这个人知识面广,自然、地理、人文、世俗智慧和经验等,通常,这跟一个人熟悉的领域,由长期观察和思考产生的洞见有关。当然还需要一点运气,学术不是苦思冥想,也许做一个梦,喝一杯下午茶,灵感就闪现了。工具变量的原理最早出现在菲利普·莱特( Philip G. Wright) 1928年写的书《The Tariff on Animal and Vegetable Oils》里。为了进一步解释这个原理,首先给出一个典型的线性回归模型:y = β0 + β1x1 + βX + ε (1)这里y为被解释变量,x1为自变量,或者解释变量,也即“因”。大写的 X 为外生控制项向量( 也即一组假定为外生的其他控制变量,例如年龄、性别等等) ,ε则为误差项。如果ε与x1不相关,那么我们可以利用OLS 模型对方程进行无偏估计。然而,如果一个重要变量x2被模型(1) 遗漏了,且x1和x2也相关,那么对β1的OLS 估计值就必然是有偏的。此时,x1被称作“内生”的解释变量,这就是 “内生性”问题。遇到“内生性”问题肿木办?有一个方法就是找工具变量Z。工具变量(IV)可以用来解决1 )遗漏变量偏差2)经典的测量误差问题3)联立性(逆向因果)工具变量的条件?变量z可以作为变量x的有效工具变量,当满足:?工具变量必须外生 ?即, Cov(z,u) = 0?工具变量必须与内生变量x相关?即, Cov(z,x) ≠0Cov(z,u) = 0无法验证,Cov(z,x) ≠0可以验证对工具变量的两个要求之间有一个非常重要的差别。因为Cov(z,u)是z与不可观测的误差u的协方差,我们无法对它进行验证或哪怕是检验:我们必须求助于经济行为或内心感受来维持这一假定。相比之下,给定一个来自总体的随机样本,z与x相关(在总体中)的条件则可加以检验。做到这一点最容易的方法是估计一个x与z之间的简单回归。就是说,Cov(z,u) = 0无法验证,我们只能依赖常识和经济理论,这需要理论修养和积累。但是我们可以检验是否Cov(z,x) ≠0,即检验H0: p1 = 0 x = p0 + p1z + v这个回归有时被称为第一阶段回归。我们要什么样的IV现在我们来看课上那个讲教育回报的经典例子在教育回报率的例子中,假定真实模型将对数工资对教育和能力回归:现在能力不可观测,而且没有代理变量IQ事实上使用的回归:将对数工资对教育回归,但由于误差项包含能力,并且教育水平与能力相关,此时会出现教育的内生性问题。z应当对y无偏效应,也不应当与其它影响y的因素相关。z?必然与内生解释变量x有着正的或负的关系。就是说Z不能和U有关,而且Z只能通过影响X来间接地影响Y。log(wage)方程,educ的工具变量z必须:(1)与能力(以及其它影响工资的不可观测的因素)不相关,(2)与教育相关。诸如一个人的社会福利登记号的最后一位数字之类的变量,几乎一定满足第一个必需条件:与能力不相关,因为它是随机决定的。然而,该变量与教育不相关,因而是educ的一个低劣的工具变量。所谓的用于遗漏变量的代理变量因相应的原因也是低劣的IV。例如,在遗漏能力的log(wage)例子中,abil的代理变量应该尽可能地与abil高度相关。而工具变量必须与abil不相关。因此,尽管IQ是abil的一个好的代理变量候选者,它却不是educ的好的工具变量。对其它可能的工具变量候选者,这些必需条件更加不确定。劳动经济学家已在工资方程中使用家庭背景变量作为教育的IV。例如,母亲的教育(motheduc)与孩子的教育是正相关的,这一点通过收集劳动者数据样本并做educ对motheduc的简单回归便可以看出来。因此,motheduc满足方程Cov(z,x) ≠0。问题是,母亲的教育也可能与孩子的能力相关(通过母亲的能力和可能通过孩子幼年所受的教养的质量)。(15.1)中educ的另一个IV选择是成长过程中兄弟姊妹的数目(sibs)。一般地说,较多的兄弟姊妹与较低的平均教育水平相联系。这样,如果兄弟姊妹的数目与能力不相关,它可以充当educ的工具变量。IV与OLS估计比较IV与OLS的标准差的不同之处仅在于将x对z回归得到的Rx,z^2由于Rx,z^21,IV的标准差会比较大。就是左老师说的比谁更有效,如果做出来当Cov(x,u) ≠ 0 ,OLS不是一致估计,当(15.4

文档评论(0)

xiaofei2001129 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档