倾向得分匹配(PSM)的匹配质量评估指标.docxVIP

倾向得分匹配(PSM)的匹配质量评估指标.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

倾向得分匹配(PSM)的匹配质量评估指标

一、PSM匹配质量评估的核心逻辑与必要性

(一)PSM的基本原理与匹配质量的关联

倾向得分匹配(PSM)是因果推断中解决选择偏差的经典方法——当研究“处理(如政策、干预)对结果(如收入、健康)的影响”时,处理组与控制组往往在可观测协变量(如年龄、教育、收入)上存在差异(比如参加培训的人可能原本教育水平更高),这种差异会混淆处理效应的估计。PSM的核心思路是:通过协变量估计每个样本的倾向得分(即样本被分配到处理组的概率),再根据倾向得分将处理组与控制组“匹配”,让匹配后的两组在协变量分布上尽可能一致,从而分离出处理的真实效应。

简单来说,PSM的目标是“让处理组和控制组‘看起来一样’”,而匹配质量评估就是验证这个目标是否实现。如果匹配质量差——比如匹配后两组的教育水平仍有显著差异,那么估计的“培训对收入的影响”就会混杂教育水平的作用,导致因果结论不可靠。因此,匹配质量评估是PSM有效性的“守门员”:它连接了方法设计与结果可靠性,是PSM从“方法工具”到“可信结论”的关键一步。

(二)匹配质量评估对因果推断有效性的影响

因果推断的本质是回答“如果没有处理,处理组会是什么结果”(反事实问题)。要可靠回答这个问题,必须确保“处理组与控制组在匹配后,除了‘是否接受处理’外,其他方面都相同”——这就是条件独立假设(即处理分配与潜在结果独立,给定协变量)。而匹配质量评估的核心,就是验证这个假设是否成立。

比如,研究“医保政策对医疗支出的影响”时,处理组是参保者,控制组是未参保者。如果匹配前参保者的收入显著高于未参保者,匹配后收入仍有差异,那么“医保对医疗支出的影响”就会被收入的差异干扰——我们无法确定支出减少是因为医保,还是因为参保者原本更有钱。只有通过匹配质量评估确认“收入、年龄、健康状况等协变量均平衡”,才能保证因果效应的估计是无偏的。

简言之,没有匹配质量评估的PSM,就像没有质检的产品:即使方法步骤正确,结果的可靠性也无法验证。匹配质量评估不是“额外步骤”,而是因果推断严谨性的必然要求。

二、匹配前的预评估:共同支撑域与倾向得分分布检查

匹配质量评估的第一步,是匹配前的预评估——这是PSM的“前提条件”。如果处理组与控制组的倾向得分没有重叠(即没有共同支撑域),或分布差异过大,后续的匹配将无法消除选择偏差。

(一)共同支撑域的概念与判断方法

共同支撑域是处理组与控制组倾向得分的重叠区域——只有当两组的倾向得分存在重叠时,才能找到“相似”的样本进行匹配。比如,处理组的倾向得分集中在0.6-0.9(即更可能参保),控制组的倾向得分集中在0.1-0.4(即更不可能参保),两者没有重叠,此时无法找到“倾向得分相似”的样本,PSM方法完全不可行。

判断共同支撑域的常用方法是观察倾向得分的分布:通过绘制直方图或核密度图,直观查看两组的倾向得分是否有重叠。比如,处理组的倾向得分直方图峰值在0.7,控制组的峰值在0.3,但两者的尾部有重叠(处理组有部分样本倾向得分0.4-0.6,控制组有部分样本0.5-0.7),那么共同支撑域就是0.5-0.6。对于不在共同支撑域内的样本(如处理组中倾向得分0.8的样本,控制组中0.2的样本),必须剔除——强行保留会导致匹配样本“不相似”,反而引入更大偏差。

共同支撑域是PSM的“红线”:没有共同支撑,就没有匹配的基础。预评估的第一步,就是确认这条“红线”是否存在。

(二)倾向得分分布的预平衡分析

即使存在共同支撑域,处理组与控制组的倾向得分分布仍可能差异过大——比如处理组的倾向得分均值是0.7,方差是0.1;控制组均值是0.3,方差是0.2。这种情况下,即使匹配,也很难让两组的协变量分布一致(因为倾向得分是协变量的压缩,分布差异大意味着协变量整体差异大)。

预平衡分析的目的是在匹配前发现这种问题,及时调整倾向得分的估计方法。比如:

如果倾向得分分布差异大,可能是协变量选择不全(比如遗漏了“健康状况”这个关键变量),需要补充协变量;

或者是倾向得分模型(如逻辑回归)没有捕捉到协变量的非线性关系(比如年龄对参保概率的影响是“先升后降”),需要加入年龄的平方项或交互项;

再或者可以改用机器学习方法(如随机森林)估计倾向得分——这类方法能更好捕捉协变量的复杂关系,让两组的倾向得分分布更接近。

预平衡分析就像匹配前的“体检”:它提前排除“无法通过匹配解决的分布差异”,避免后续工作的无效性。

三、匹配后的平衡检验:协变量分布的同质化评估

匹配后的平衡检验是评估匹配质量的核心——它直接验证“处理组与控制组在匹配后,协变量分布是否一致”。平衡检验分为三个层次:单变量平衡、多变量平衡、个体层面的匹配精度。

(一)单变量平衡检验:均值与方差的比较

单变量平衡检验是“逐个检查”每个协变量的分布

文档评论(0)

139****1575 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档