计量经济学“双重稳健估计”的应用.docxVIP

下载本文档

0
0
约6.89千字
约 14页
2026-02-10 发布于江苏
举报

计量经济学“双重稳健估计”的应用.docx

计量经济学“双重稳健估计”的应用

一、双重稳健估计的理论内核与计量逻辑

（一）双重稳健估计的定义与核心特征

在计量经济学的因果推断框架中，双重稳健估计是一种融合了“倾向得分模型”与“结果模型”的复合估计方法，其核心价值在于“容错性”——只要两个模型中的任意一个被正确设定，最终对因果效应的估计结果就能保持一致性（即随着样本量增大，估计值会趋近于真实值）。

要理解这一特征，我们可以用一个通俗的例子：假设我们想研究“职业培训对农民收入的影响”，传统方法要么单独依赖“倾向得分模型”（估计农民参加培训的概率，比如用年龄、教育程度、家庭耕地面积等变量），要么单独依赖“结果模型”（用回归方程估计收入与培训的关系）。如果倾向得分模型漏掉了“是否有外出务工经历”这个关键变量，那么估计的“参加培训概率”就会偏差，导致后续匹配或加权的结果不准确；如果结果模型错把“收入”与“培训”的关系设定为线性（而实际是非线性，比如培训对高学历农民的收入提升更明显），回归结果也会偏误。

但双重稳健估计的逻辑是“两条腿走路”：它同时用倾向得分模型估计“参加培训的概率”，用结果模型估计“收入的生成过程”，再通过加权或调整的方式将两个模型的信息结合。比如，先用倾向得分的“逆概率”对样本加权（让处理组和控制组的特征更平衡），再用回归模型拟合加权后的收入数据；或者先用回归模型调整混杂因素，再用倾向得分加权修正剩余偏差。此时，只要倾向得分模型或结果模型中的任意一个准确捕捉了真实关系——比如倾向得分模型漏掉了“外出务工经历”，但结果模型里包含了这个变量，或者结果模型的线性设定有误，但倾向得分模型准确估计了培训概率——最终的收入效应估计就不会偏差。这种“二选一”的容错机制，正是“双重稳健”的核心含义。

（二）双重稳健估计与传统计量方法的对比

为了更清晰地理解双重稳健估计的优势，我们可以将其与三种传统方法对比：

倾向得分匹配（PSM）：PSM的核心是“找相似的人”——通过倾向得分将参加培训的农民（处理组）与未参加的农民（控制组）匹配，再比较他们的收入差。但PSM完全依赖倾向得分模型的准确性：如果倾向得分估计偏差（比如漏掉关键变量），匹配后的样本就会“不相似”，结果自然偏误。

逆概率加权（IPW）：IPW用倾向得分的倒数对样本加权，让处理组和控制组的特征分布与总体一致。但IPW同样“押注”倾向得分模型：如果倾向得分估计错误，加权后的样本会过度放大某些个体的影响（比如倾向得分接近0的个体，权重会非常大），导致方差急剧上升。

回归调整（RA）：RA直接将处理变量和混杂因素放进回归方程，通过控制混杂因素来估计处理效应。但RA的局限性是“函数形式依赖”：如果结果模型的设定错误（比如应该用对数收入却用了水平值），或者遗漏了混杂因素，结果就会偏差。

相比之下，双重稳健估计的“双重保险”机制弥补了单一方法的脆弱性。比如，在“培训对收入的影响”研究中，若PSM因为倾向得分估计错误导致结果偏误（比如高估了10%），RA因为模型设定错误导致结果偏误（比如低估了8%），双重稳健估计可能会给出更接近真实值的结果——因为它同时利用了两个模型的信息，抵消了部分偏差。这种“稳健性”正是双重稳健估计在实证研究中越来越受欢迎的关键原因。

二、双重稳健估计的典型应用场景与实践价值

理解了理论逻辑后，我们可以进一步探讨双重稳健估计在实证研究中的具体应用场景——它的价值主要体现在“处理模型误设风险”和“控制复杂混杂因素”的场景中，以下是两个最常见的领域：

（一）缺失数据处理中的双重稳健估计

实证研究中，数据缺失是“家常便饭”：比如家庭收入调查中，部分受访者不愿透露收入；健康调查中，部分患者遗漏了医疗费用记录。传统的处理方法（如均值填充、删除缺失样本）要么导致方差低估，要么引发样本选择偏差，而双重稳健估计提供了更可靠的解决方案。

以“健康调查中的医疗费用缺失问题”为例：假设我们需要分析“医保对医疗费用的影响”，但有20%的患者未填写“住院费用”。此时，双重稳健估计的步骤是：

第一步：估计“缺失概率”（倾向得分模型）：用患者的年龄、性别、病情严重程度、是否有医保、医院等级等变量，估计“未填写住院费用”的概率（即倾向得分）。

第二步：估计“费用生成模型”（结果模型）：用未缺失的住院费用数据，拟合住院费用与病情、医保、医院等级等变量的回归方程。

第三步：双重稳健填充：结合前两个模型，对缺失的住院费用进行填充——如果倾向得分模型正确（即准确捕捉了“谁更可能漏填费用”），即使结果模型有偏差，填充的费用也能反映真实水平；如果结果模型正确（即准确拟合了费用与变量的关系），即使倾向得分模型有偏差，填充结果也可靠。

与传统的均值填充相比，双重稳健填充的优势在于“不假设缺失是随机的”：比如，病情严重的患者更可能漏填费用（非随机缺失），均值填充会

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

计量经济学“双重稳健估计”的应用.docxVIP