工具变量法的两阶段最小二乘残差.docxVIP

工具变量法的两阶段最小二乘残差.docx

此文档为 AI 生成,请仔细甄别后使用
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

工具变量法的两阶段最小二乘残差

一、引言:从内生性问题到工具变量法的兴起

在计量经济学的研究中,我们常遇到这样的困境:当解释变量与误差项存在相关性(内生性问题)时,普通最小二乘法(OLS)估计量会失去一致性,就像用变形的尺子量身高,结果再怎么计算都是歪的。这时候,工具变量法(IV)就像一把“校准尺”,通过引入与内生变量高度相关、但与误差项无关的工具变量,为解决内生性问题提供了关键思路。而两阶段最小二乘法(2SLS)作为工具变量法最常用的实现方式,其残差不仅是模型拟合效果的直观反映,更隐藏着模型设定合理性、工具变量有效性的关键信息。

记得刚入行时,我在研究教育水平对收入的影响时,发现直接用OLS回归会高估教育的回报率——那些更聪明、更勤奋的人往往教育水平更高,而这些未被观测的特质(如能力)同时影响收入,导致教育变量内生。当时导师提醒我:“试试工具变量法,找个外生的工具变量,比如父母的教育水平。”但当我用2SLS做完回归后,盯着输出的残差结果却犯了迷糊:这些残差和OLS的残差有什么不同?为什么老师说不能直接用残差做后续检验?带着这些疑问,我开始深入探究2SLS残差的本质,这也是本文想要分享的核心内容。

二、两阶段最小二乘法的核心逻辑与操作流程

要理解2SLS残差,首先需要明确两阶段最小二乘法的具体操作步骤。2SLS的“两阶段”就像盖房子打地基和建主体,每一阶段都有明确的目标,而残差正是在第二阶段“建主体”时产生的“建筑废料”,其特征与两阶段的操作密切相关。

(一)第一阶段:工具变量对内生变量的预测

第一阶段的核心任务是“净化”内生变量。假设我们有模型(Y=_0+_1X+u),其中(X)是内生变量(与(u)相关)。我们需要找一个工具变量(Z),满足两个关键条件:一是相关性((Z)与(X)高度相关,否则工具变量太“弱”,无法有效预测(X));二是外生性((Z)与(u)不相关,否则工具变量自身引入新的内生性)。

第一阶段的具体操作是用所有外生变量(包括模型中的外生变量和工具变量(Z))对内生变量(X)做OLS回归,得到(X)的预测值()。例如,在教育回报率研究中,第一阶段就是用父母教育水平(工具变量)和其他外生变量(如性别、地区)回归受教育年限(内生变量),得到“净化后的”受教育年限预测值()。这个预测值剥离了(X)中与误差项(u)相关的部分,只保留与工具变量(Z)相关的外生变异。

(二)第二阶段:用预测值完成主回归

第二阶段则是用第一阶段得到的()替代原模型中的内生变量(X),对被解释变量(Y)做OLS回归,即(Y=_0+_1+e),这里的(e)就是2SLS的残差。这一步的逻辑是:既然()是(X)中外生部分的“镜像”,用它回归得到的系数(_1)就能避免内生性偏差。

需要注意的是,第二阶段的残差(e)与原模型的真实误差项(u)并不完全相同。原模型的误差项(u)包含了所有未被观测的影响(Y)的因素,而(e)则是(Y)与用()预测的(Y)之间的差异,既包含(u)的信息,也包含(X)中未被()捕捉的内生部分(即(X-))与(_1)的乘积。这一点是理解2SLS残差特性的关键。

(三)2SLS估计量与OLS的本质区别

对比OLS和2SLS,OLS直接用(X)回归(Y),得到的残差是(Y-{OLS});而2SLS先用(Z)预测(),再用()预测(Y),残差是(Y-{2SLS})。两者的根本区别在于,2SLS通过工具变量“过滤”了(X)中的内生部分,因此其残差不再包含(X)与(u)的相关性信息。打个比方,OLS的残差像一锅混合汤,里面有内生变量的“杂质”;而2SLS的残差则像过滤后的汤,杂质被工具变量这层“滤网”去掉了。

三、2SLS残差的定义与计算原理

(一)残差的数学表达式推导

从数学上看,2SLS的残差可以表示为:

({2SLS}=Y-X{2SLS})

其中({2SLS}=(X’P_ZX)^{-1}X’P_ZY),(P_Z=Z(Z’Z)^{-1}Z’)是投影矩阵(将变量投影到工具变量张成的空间)。展开后,({2SLS}=Y-X(X’P_ZX)^{-1}X’P_ZY=(I-X(X’P_ZX)^{-1}X’P_Z)Y)。

这个表达式看起来复杂,但核心含义是:2SLS

文档评论(0)

甜甜微笑 + 关注
实名认证
文档贡献者

好好学习

1亿VIP精品文档

相关文档