倾向得分匹配（PSM）的匹配质量评估指标.docxVIP

下载本文档

0
0
约5.63千字
约 12页
2025-12-31 发布于江苏
举报
版权申诉

倾向得分匹配（PSM）的匹配质量评估指标.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

倾向得分匹配（PSM）的匹配质量评估指标

一、PSM匹配质量评估的核心逻辑与必要性

（一）PSM的基本原理与匹配质量的关联

倾向得分匹配（PSM）是因果推断中解决选择偏差的经典方法——当研究“处理（如政策、干预）对结果（如收入、健康）的影响”时，处理组与控制组往往在可观测协变量（如年龄、教育、收入）上存在差异（比如参加培训的人可能原本教育水平更高），这种差异会混淆处理效应的估计。PSM的核心思路是：通过协变量估计每个样本的倾向得分（即样本被分配到处理组的概率），再根据倾向得分将处理组与控制组“匹配”，让匹配后的两组在协变量分布上尽可能一致，从而分离出处理的真实效应。

简单来说，PSM的目标是“让处理组和控制组‘看起来一样’”，而匹配质量评估就是验证这个目标是否实现。如果匹配质量差——比如匹配后两组的教育水平仍有显著差异，那么估计的“培训对收入的影响”就会混杂教育水平的作用，导致因果结论不可靠。因此，匹配质量评估是PSM有效性的“守门员”：它连接了方法设计与结果可靠性，是PSM从“方法工具”到“可信结论”的关键一步。

（二）匹配质量评估对因果推断有效性的影响

因果推断的本质是回答“如果没有处理，处理组会是什么结果”（反事实问题）。要可靠回答这个问题，必须确保“处理组与控制组在匹配后，除了‘是否接受处理’外，其他方面都相同”——这就是条件独立假设（即处理分配与潜在结果独立，给定协变量）。而匹配质量评估的核心，就是验证这个假设是否成立。

比如，研究“医保政策对医疗支出的影响”时，处理组是参保者，控制组是未参保者。如果匹配前参保者的收入显著高于未参保者，匹配后收入仍有差异，那么“医保对医疗支出的影响”就会被收入的差异干扰——我们无法确定支出减少是因为医保，还是因为参保者原本更有钱。只有通过匹配质量评估确认“收入、年龄、健康状况等协变量均平衡”，才能保证因果效应的估计是无偏的。

简言之，没有匹配质量评估的PSM，就像没有质检的产品：即使方法步骤正确，结果的可靠性也无法验证。匹配质量评估不是“额外步骤”，而是因果推断严谨性的必然要求。

二、匹配前的预评估：共同支撑域与倾向得分分布检查

匹配质量评估的第一步，是匹配前的预评估——这是PSM的“前提条件”。如果处理组与控制组的倾向得分没有重叠（即没有共同支撑域），或分布差异过大，后续的匹配将无法消除选择偏差。

（一）共同支撑域的概念与判断方法

共同支撑域是处理组与控制组倾向得分的重叠区域——只有当两组的倾向得分存在重叠时，才能找到“相似”的样本进行匹配。比如，处理组的倾向得分集中在0.6-0.9（即更可能参保），控制组的倾向得分集中在0.1-0.4（即更不可能参保），两者没有重叠，此时无法找到“倾向得分相似”的样本，PSM方法完全不可行。

判断共同支撑域的常用方法是观察倾向得分的分布：通过绘制直方图或核密度图，直观查看两组的倾向得分是否有重叠。比如，处理组的倾向得分直方图峰值在0.7，控制组的峰值在0.3，但两者的尾部有重叠（处理组有部分样本倾向得分0.4-0.6，控制组有部分样本0.5-0.7），那么共同支撑域就是0.5-0.6。对于不在共同支撑域内的样本（如处理组中倾向得分0.8的样本，控制组中0.2的样本），必须剔除——强行保留会导致匹配样本“不相似”，反而引入更大偏差。

共同支撑域是PSM的“红线”：没有共同支撑，就没有匹配的基础。预评估的第一步，就是确认这条“红线”是否存在。

（二）倾向得分分布的预平衡分析

即使存在共同支撑域，处理组与控制组的倾向得分分布仍可能差异过大——比如处理组的倾向得分均值是0.7，方差是0.1；控制组均值是0.3，方差是0.2。这种情况下，即使匹配，也很难让两组的协变量分布一致（因为倾向得分是协变量的压缩，分布差异大意味着协变量整体差异大）。

预平衡分析的目的是在匹配前发现这种问题，及时调整倾向得分的估计方法。比如：

如果倾向得分分布差异大，可能是协变量选择不全（比如遗漏了“健康状况”这个关键变量），需要补充协变量；

或者是倾向得分模型（如逻辑回归）没有捕捉到协变量的非线性关系（比如年龄对参保概率的影响是“先升后降”），需要加入年龄的平方项或交互项；

再或者可以改用机器学习方法（如随机森林）估计倾向得分——这类方法能更好捕捉协变量的复杂关系，让两组的倾向得分分布更接近。

预平衡分析就像匹配前的“体检”：它提前排除“无法通过匹配解决的分布差异”，避免后续工作的无效性。

三、匹配后的平衡检验：协变量分布的同质化评估

匹配后的平衡检验是评估匹配质量的核心——它直接验证“处理组与控制组在匹配后，协变量分布是否一致”。平衡检验分为三个层次：单变量平衡、多变量平衡、个体层面的匹配精度。

（一）单变量平衡检验：均值与方差的比较

单变量平衡检验是“逐个检查”每个协变量的分布

您可能关注的文档

文档评论（0）

139****1575 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

倾向得分匹配（PSM）的匹配质量评估指标.docxVIP