因果推断中的倾向得分匹配（PSM）有效性评估.docxVIP

下载本文档

0
0
约5.01千字
约 9页
2025-12-29 发布于上海
举报
版权申诉

因果推断中的倾向得分匹配（PSM）有效性评估.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

因果推断中的倾向得分匹配（PSM）有效性评估

引言

在因果推断领域，如何准确识别干预措施与结果变量之间的因果关系，始终是研究的核心挑战。倾向得分匹配（PropensityScoreMatching,PSM）作为一种通过平衡协变量分布来减少选择偏差的统计方法，自20世纪80年代被提出以来，已广泛应用于医学、经济学、社会学等多个领域。例如，评估某类药物对患者康复的影响、分析教育政策对学生学业表现的作用等场景中，PSM通过构建“反事实”对照组，为因果效应的估计提供了重要工具。然而，PSM的有效性并非天然成立——其结果的可靠性高度依赖于方法应用的规范性、假设条件的满足程度以及匹配质量的优劣。若忽视对PSM有效性的系统评估，可能导致因果效应估计出现偏差，甚至得出错误结论。因此，深入探讨PSM有效性评估的逻辑、方法与实践要点，对提升因果推断研究的科学性具有重要意义。

一、PSM的基本原理与核心假设

要评估PSM的有效性，首先需要理解其底层逻辑与依赖的前提条件。PSM的核心思想是通过“倾向得分”这一综合指标，将受干预组（TreatmentGroup）与对照组（ControlGroup）中具有相似特征的个体进行匹配，从而模拟随机对照试验（RCT）的效果，消除观测到的协变量差异对因果效应的干扰。

（一）倾向得分的定义与作用

倾向得分是指在给定一组协变量（如年龄、性别、病史等观测到的混杂因素）的情况下，个体接受干预的概率。具体而言，倾向得分通过逻辑回归（LogisticRegression）或其他分类模型计算得出，公式表现为(P(X)=Pr(T=1|X))，其中(T)表示是否接受干预（1为是，0为否），(X)表示协变量集合。倾向得分的作用在于将高维的协变量信息压缩为一维的概率值，使得原本需要匹配多个协变量的复杂操作，转化为对单一倾向得分值的匹配。例如，在评估某种新型教学方法对学生成绩的影响时，协变量可能包括学生的初始成绩、家庭背景、学习时长等多个维度，通过计算倾向得分，研究者可以将这些变量综合为一个“接受新教学方法的概率”，进而根据这一概率值为每个接受新方法的学生找到特征相似的对照学生。

（二）PSM的核心假设

PSM的有效性建立在两个关键假设之上，若假设不成立，匹配结果可能无法准确反映真实因果关系。

第一个假设是“可忽略性”（Ignorability），即给定观测到的协变量(X)，干预分配(T)与潜在结果(Y)独立。通俗来说，所有影响干预分配和结果的混杂因素都已被观测并纳入协变量集合，不存在未观测到的混杂变量（UnobservedConfounders）。例如，在评估药物效果时，若患者是否接受药物治疗仅由年龄、病情严重程度等可观测因素决定，而与未记录的遗传因素无关，则可忽略性假设成立；反之，若遗传因素同时影响治疗选择和康复结果，且未被纳入协变量，匹配结果将因遗漏变量而产生偏差。

第二个假设是“重叠性”（Overlap），即对于所有协变量(X)，倾向得分的取值范围在干预组和对照组中存在重叠。换句话说，不存在某类个体仅出现在干预组或仅出现在对照组的情况。例如，若干预组中所有个体的倾向得分都高于0.8，而对照组中所有个体的倾向得分都低于0.3，那么两组间没有重叠区域，无法找到匹配对象，此时PSM无法有效应用，强行匹配会导致结果不可靠。

二、PSM有效性评估的关键维度

明确PSM的原理与假设后，需从多个维度对其有效性进行系统评估。这些评估既包括对假设条件的验证，也涵盖对匹配质量的量化分析，以及对因果效应估计结果的稳健性检验。

（一）假设条件的验证：可忽略性与重叠性的检验

可忽略性假设的验证是PSM有效性评估的起点，但也是最具挑战性的环节。由于该假设要求“所有混杂因素已被观测”，而现实中研究者往往无法完全确认是否遗漏了关键变量，因此通常采用间接方法进行检验。一种常用策略是“安慰剂检验”（PlaceboTest）：选择一个理论上与干预无关的变量作为“伪结果”，若PSM匹配后该变量在干预组与对照组间仍存在显著差异，则提示可能存在未观测到的混杂因素。例如，在评估教育政策对收入的影响时，若选择“身高”作为伪结果（理论上与教育政策无关），匹配后两组身高仍有显著差异，可能意味着存在未被控制的混杂变量（如家庭社会经济地位）同时影响教育政策参与和身高（通过营养条件等途径）。

重叠性假设的检验相对直接，主要通过绘制倾向得分的分布直方图或密度曲线来观察干预组与对照组的重叠情况。理想情况下，两组的倾向得分分布应存在明显的重叠区域，且重叠部分覆盖大部分样本。若发现某组的倾向得分分布完全在另一组之外（如干预组倾向得分集中在0.7-1.0，对照组集中在0.1-0.4），则需通过“截断”（Trimming）处理，剔除