倾向得分匹配的样本选择偏差纠正.docxVIP

下载本文档

0
0
约5.26千字
约 10页
2026-01-16 发布于江苏
举报
版权申诉

倾向得分匹配的样本选择偏差纠正.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

倾向得分匹配的样本选择偏差纠正

一、引言：样本选择偏差与因果推断的困境

在社会科学、医学研究、经济学等领域，观察性研究是探索因果关系的重要手段。与随机对照试验（RCT）不同，观察性研究无法通过随机分配干预组与对照组来平衡潜在混杂因素，这使得研究结果容易受到“样本选择偏差”的干扰。简单来说，样本选择偏差是指干预组与对照组的样本并非随机形成，而是受到某些可观测或不可观测因素的影响，导致两组在关键特征上存在系统性差异。例如，在评估某教育政策的效果时，选择参与政策的学校可能本身就具备更好的师资力量或学生基础，若直接比较参与组与未参与组的学业成绩，结果可能高估政策的实际作用。

如何科学纠正样本选择偏差，成为因果推断领域的核心挑战。倾向得分匹配（PropensityScoreMatching,PSM）作为一种基于观测数据的统计方法，通过构建“倾向得分”指标，将干预组与对照组中特征相似的样本进行匹配，从而模拟随机试验的效果。自20世纪80年代被提出以来，PSM已广泛应用于公共政策评估、医疗效果分析、市场策略验证等场景，成为解决样本选择偏差的重要工具。本文将围绕倾向得分匹配的原理、实施步骤及应用局限展开系统探讨，以期为研究者提供清晰的方法学参考。

二、样本选择偏差：因果推断的“隐形障碍”

（一）样本选择偏差的表现形式与危害

样本选择偏差的本质是干预分配的非随机性。在观察性研究中，个体是否接受干预（如是否购买某产品、是否参与某项目）往往与自身特征（如年龄、收入、健康状况）密切相关。这些特征既可能影响干预分配，又可能影响研究的结果变量，从而成为混杂因素。例如，在研究“某新型药物对高血压患者的疗效”时，若医生更倾向于将药物开给病情更严重的患者，那么直接比较服药组与未服药组的血压变化，可能错误地得出“药物无效”的结论——因为服药组患者的基线病情更重，即使药物有效，其血压改善可能被病情差异掩盖。

样本选择偏差的危害主要体现在两个方面：一是导致因果效应估计的偏误，即研究者可能高估或低估干预的真实效果；二是削弱研究结论的外推性，若样本选择机制未被充分控制，研究结果可能仅适用于特定群体，无法推广到更广泛的总体。

（二）传统纠正方法的局限性

在PSM出现前，研究者主要通过多元回归分析来控制混杂因素。这种方法假设所有混杂变量已被观测并纳入模型，通过回归系数调整干预变量对结果的影响。但实际研究中，混杂变量可能数量庞大（如成百上千个特征），直接纳入回归模型会导致自由度损失、多重共线性等问题；此外，若存在未观测到的混杂变量（如个体的主观偏好），回归分析无法消除其影响，仍可能残留选择偏差。

另一种常用方法是分层分析，即将样本按关键特征（如年龄、性别）分层，在每层内比较干预组与对照组的差异。但分层分析的效果依赖于分层变量的选择，且当变量为连续型（如收入、体重）或高维变量时，分层会变得复杂，甚至出现“维度灾难”——即分层过多导致每层样本量不足，无法进行有效比较。

三、倾向得分匹配：原理与逻辑基础

（一）倾向得分的定义与核心思想

倾向得分（PropensityScore）是指在给定可观测协变量的情况下，个体接受干预的概率。用通俗的语言解释，倾向得分是一个“综合指标”，它将多个可能影响干预分配的协变量（如年龄、教育水平、健康指标等）压缩为一个0到1之间的概率值。例如，对于“是否参与职业培训”的干预，倾向得分高的个体（如30岁、高中学历、低收入者）更可能参与培训，而倾向得分低的个体（如25岁、大学学历、高收入者）参与概率更低。

倾向得分匹配的核心思想是“平衡协变量”。通过将干预组与对照组中倾向得分相近的样本进行匹配，研究者可以构建一个“伪随机”的对照组，使得匹配后的两组在可观测协变量上的分布趋于一致。此时，干预组与对照组的结果差异可更可信地归因于干预本身，而非协变量的差异。

（二）倾向得分匹配的理论依据：强可忽略性假设

倾向得分匹配的有效性依赖于“强可忽略性假设”（StrongIgnorability），即干预分配仅依赖于可观测的协变量，且在给定这些协变量的情况下，干预分配与潜在结果无关。换句话说，所有可能影响干预分配和结果的混杂因素都已被观测并纳入倾向得分模型。虽然这一假设无法通过数据直接验证（因为未观测变量无法检验），但研究者可通过尽可能全面地收集协变量、进行平衡性检验等方式提高假设的合理性。

（三）倾向得分与协变量平衡的关系

倾向得分的关键作用在于“降维”。假设研究者关注k个协变量，直接匹配k维空间中的样本几乎不可能（尤其是当k较大时），而倾向得分将k维信息压缩为1维，大大降低了匹配的复杂度。更重要的是，若倾向得分模型正确，匹配后的干预组与对照组在所有k个协变量上的分布应趋于平衡。例如，匹配前干预组的平均年龄为40岁，对照组为35岁；匹配后，两组的平均年龄应接近（