工具变量法的两阶段最小二乘残差.docxVIP

下载本文档

2
0
约5.62千字
约 6页
2025-09-13 发布于上海
举报
版权申诉

工具变量法的两阶段最小二乘残差.docx

此文档为 AI 生成，请仔细甄别后使用

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

工具变量法的两阶段最小二乘残差

一、引言：从内生性问题到工具变量法的兴起

在计量经济学的研究中，我们常遇到这样的困境：当解释变量与误差项存在相关性（内生性问题）时，普通最小二乘法（OLS）估计量会失去一致性，就像用变形的尺子量身高，结果再怎么计算都是歪的。这时候，工具变量法（IV）就像一把“校准尺”，通过引入与内生变量高度相关、但与误差项无关的工具变量，为解决内生性问题提供了关键思路。而两阶段最小二乘法（2SLS）作为工具变量法最常用的实现方式，其残差不仅是模型拟合效果的直观反映，更隐藏着模型设定合理性、工具变量有效性的关键信息。

记得刚入行时，我在研究教育水平对收入的影响时，发现直接用OLS回归会高估教育的回报率——那些更聪明、更勤奋的人往往教育水平更高，而这些未被观测的特质（如能力）同时影响收入，导致教育变量内生。当时导师提醒我：“试试工具变量法，找个外生的工具变量，比如父母的教育水平。”但当我用2SLS做完回归后，盯着输出的残差结果却犯了迷糊：这些残差和OLS的残差有什么不同？为什么老师说不能直接用残差做后续检验？带着这些疑问，我开始深入探究2SLS残差的本质，这也是本文想要分享的核心内容。

二、两阶段最小二乘法的核心逻辑与操作流程

要理解2SLS残差，首先需要明确两阶段最小二乘法的具体操作步骤。2SLS的“两阶段”就像盖房子打地基和建主体，每一阶段都有明确的目标，而残差正是在第二阶段“建主体”时产生的“建筑废料”，其特征与两阶段的操作密切相关。

（一）第一阶段：工具变量对内生变量的预测

第一阶段的核心任务是“净化”内生变量。假设我们有模型(Y=_0+_1X+u)，其中(X)是内生变量（与(u)相关）。我们需要找一个工具变量(Z)，满足两个关键条件：一是相关性（(Z)与(X)高度相关，否则工具变量太“弱”，无法有效预测(X)）；二是外生性（(Z)与(u)不相关，否则工具变量自身引入新的内生性）。

第一阶段的具体操作是用所有外生变量（包括模型中的外生变量和工具变量(Z)）对内生变量(X)做OLS回归，得到(X)的预测值()。例如，在教育回报率研究中，第一阶段就是用父母教育水平（工具变量）和其他外生变量（如性别、地区）回归受教育年限（内生变量），得到“净化后的”受教育年限预测值()。这个预测值剥离了(X)中与误差项(u)相关的部分，只保留与工具变量(Z)相关的外生变异。

（二）第二阶段：用预测值完成主回归

第二阶段则是用第一阶段得到的()替代原模型中的内生变量(X)，对被解释变量(Y)做OLS回归，即(Y=_0+_1+e)，这里的(e)就是2SLS的残差。这一步的逻辑是：既然()是(X)中外生部分的“镜像”，用它回归得到的系数(_1)就能避免内生性偏差。

需要注意的是，第二阶段的残差(e)与原模型的真实误差项(u)并不完全相同。原模型的误差项(u)包含了所有未被观测的影响(Y)的因素，而(e)则是(Y)与用()预测的(Y)之间的差异，既包含(u)的信息，也包含(X)中未被()捕捉的内生部分（即(X-)）与(_1)的乘积。这一点是理解2SLS残差特性的关键。

（三）2SLS估计量与OLS的本质区别

对比OLS和2SLS，OLS直接用(X)回归(Y)，得到的残差是(Y-{OLS})；而2SLS先用(Z)预测()，再用()预测(Y)，残差是(Y-{2SLS})。两者的根本区别在于，2SLS通过工具变量“过滤”了(X)中的内生部分，因此其残差不再包含(X)与(u)的相关性信息。打个比方，OLS的残差像一锅混合汤，里面有内生变量的“杂质”；而2SLS的残差则像过滤后的汤，杂质被工具变量这层“滤网”去掉了。

三、2SLS残差的定义与计算原理

（一）残差的数学表达式推导

从数学上看，2SLS的残差可以表示为：

({2SLS}=Y-X{2SLS})

其中({2SLS}=(X’P_ZX)^{-1}X’P_ZY)，(P_Z=Z(Z’Z)^{-1}Z’)是投影矩阵（将变量投影到工具变量张成的空间）。展开后，({2SLS}=Y-X(X’P_ZX)^{-1}X’P_ZY=(I-X(X’P_ZX)^{-1}X’P_Z)Y)。

这个表达式看起来复杂，但核心含义是：2SLS

您可能关注的文档

文档评论（0）

甜甜微笑 + 关注: 实名认证

文档贡献者

好好学习

咨询Ta 进入空间

1亿VIP精品文档

更多 >

工具变量法的两阶段最小二乘残差.docxVIP