倾向得分匹配法的卡尺.docxVIP

下载本文档

1
0
约5.53千字
约 6页
2025-09-13 发布于上海
举报
版权申诉

倾向得分匹配法的卡尺.docx

此文档为 AI 生成，请仔细甄别后使用

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

倾向得分匹配法的卡尺

在因果推断的实证研究中，倾向得分匹配（PropensityScoreMatching,PSM）是一把“利器”——它通过将处理组与对照组在倾向得分上进行匹配，尽可能消除混杂变量的干扰，从而更准确地估计处理效应。但这把“利器”能否精准“切割”出可靠的因果关系，有一个关键参数至关重要：卡尺（Caliper）。它就像匹配过程中的“标尺”，决定了处理组与对照组样本可以“走多近”才能成为匹配对。本文将从卡尺的基本概念出发，逐层拆解其在PSM中的作用机制、设置逻辑、实际应用中的权衡与挑战，带读者深入理解这个“小参数”背后的大学问。

一、从倾向得分匹配说起：为什么需要“卡尺”？

要理解卡尺的意义，首先需要回顾倾向得分匹配的核心逻辑。在观察性研究中，我们无法像随机对照试验（RCT）那样主动分配处理（如药物治疗、政策实施），因此处理组与对照组可能存在系统性差异（即选择偏差）。倾向得分匹配的思路是：通过一个Logit或Probit模型，将所有可能影响处理分配的协变量（如年龄、收入、健康状况）压缩成一个概率值——倾向得分（PropensityScore,PS），即每个样本接受处理的概率。理论上，若两个样本的倾向得分相同，它们在协变量上的分布也应相同，此时比较它们的结局变量差异，就能得到无偏的处理效应。

但理想与现实总有差距。实际研究中，倾向得分完全相同的样本几乎不存在，因此需要通过“匹配”找到倾向得分相近的样本对。这时候问题来了：多近才算“相近”？如果没有明确的标准，可能出现两种极端：要么为了保留更多样本，匹配倾向得分差异较大的样本（导致协变量不平衡，估计偏差大）；要么过度追求“相近”，只保留极少数匹配对（导致样本量不足，估计效率低）。这时候，“卡尺”就登场了——它通过设定一个最大允许的倾向得分差异阈值（通常表示为倾向得分的绝对差或标准化差），为匹配过程划定了一条“红线”：只有倾向得分差异小于等于卡尺宽度的样本对，才能被纳入匹配。

简单来说，卡尺的作用可以概括为“质量与数量的平衡器”：它既避免了匹配质量过差（宽卡尺）导致的偏差，又防止了样本流失过多（窄卡尺）导致的效率损失。这种平衡，正是因果推断中“偏差-方差权衡”（Bias-VarianceTradeoff）的具体体现。

二、卡尺的“度量衡”：定义、形式与常见设置

2.1卡尺的数学定义与常见形式

从数学上看，卡尺是一个预先设定的阈值()，要求处理组样本(i)与对照组样本(j)的倾向得分绝对差不超过()，即：

[|PS_i-PS_j|]

实际应用中，卡尺的形式主要有两种：

-原始倾向得分差：直接以倾向得分的绝对差值为阈值（如()）。这种形式简单直观，但受倾向得分取值范围（0-1）的影响，当倾向得分接近0或1时，即使绝对差较小，相对差异可能很大。

-标准化倾向得分差：将倾向得分的绝对差除以其标准差（即(=kSD(PS))，其中(k)为常数，常见取值0.1-0.2）。这种形式考虑了倾向得分的离散程度，更具可比性，尤其适用于不同研究或不同数据集之间的对比。

例如，某研究中倾向得分的标准差为0.15，若取(k=0.2)，则卡尺宽度为0.03（0.2×0.15），即要求处理组与对照组的倾向得分绝对差不超过0.03。

2.2卡尺的经验法则与数据驱动设置

关于卡尺宽度的选择，学术界没有“放之四海而皆准”的标准，但形成了一些经验法则和数据驱动的方法：

（1）经验法则：基于“常识”的快速设定

最常见的经验法则是取标准化倾向得分差的0.1-0.2倍标准差（即(k=0.1)或(k=0.2)）。这一建议源于早期研究对匹配质量的观察——当(k=0.2)时，匹配后的协变量平衡通常能达到可接受水平，而样本流失率不会过高。例如，在教育政策评估中，若处理组样本量本身不大（如200例），取(k=0.2)可能比(k=0.1)更合理，因为后者可能导致匹配对不足50例，影响统计效力。

但经验法则的局限性也很明显：它没有考虑具体数据的分布特征。例如，若倾向得分在处理组和对照组中重叠度很高（即大部分样本的倾向得分集中在0.3-0.7之间），即使取(k=0.3)也可能得到高质量匹配；反之，若重叠度低（如处理组倾向得分集中在0.8-1.0，对照组集中在0.1-0.3），即使取(k=0.1)也可能无法找到匹配对，此时可能需要放宽卡尺或考虑其他方法（如核匹配、分层匹配）。

（2）数据驱动：基于平衡检验的优化

更严谨的做法是通过“数据驱动”方法确定卡尺宽度，核心思路是：在不同的卡尺宽度下，比较匹配后的协变量平衡情况，选择在保留足够样本量的同时，使协变量偏差最小的卡尺。具体步骤通常包括：

1.计算倾向得分并生成处理组与对照组的倾向得分分布；

2.设定一个卡尺宽度范围（如从0.01到0.3，步长0.0

您可能关注的文档

文档评论（0）

杜家小钰 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

倾向得分匹配法的卡尺.docxVIP