- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
倾向得分匹配(PSM)的匹配质量评估指标
一、PSM匹配质量评估的核心逻辑与必要性
(一)PSM的基本原理与匹配质量的关联
倾向得分匹配(PSM)是因果推断中解决选择偏差的经典方法——当研究“处理(如政策、干预)对结果(如收入、健康)的影响”时,处理组与控制组往往在可观测协变量(如年龄、教育、收入)上存在差异(比如参加培训的人可能原本教育水平更高),这种差异会混淆处理效应的估计。PSM的核心思路是:通过协变量估计每个样本的倾向得分(即样本被分配到处理组的概率),再根据倾向得分将处理组与控制组“匹配”,让匹配后的两组在协变量分布上尽可能一致,从而分离出处理的真实效应。
简单来说,PSM的目标是“让处理组和控制组‘看起来一样’”,而匹配质量评估就是验证这个目标是否实现。如果匹配质量差——比如匹配后两组的教育水平仍有显著差异,那么估计的“培训对收入的影响”就会混杂教育水平的作用,导致因果结论不可靠。因此,匹配质量评估是PSM有效性的“守门员”:它连接了方法设计与结果可靠性,是PSM从“方法工具”到“可信结论”的关键一步。
(二)匹配质量评估对因果推断有效性的影响
因果推断的本质是回答“如果没有处理,处理组会是什么结果”(反事实问题)。要可靠回答这个问题,必须确保“处理组与控制组在匹配后,除了‘是否接受处理’外,其他方面都相同”——这就是条件独立假设(即处理分配与潜在结果独立,给定协变量)。而匹配质量评估的核心,就是验证这个假设是否成立。
比如,研究“医保政策对医疗支出的影响”时,处理组是参保者,控制组是未参保者。如果匹配前参保者的收入显著高于未参保者,匹配后收入仍有差异,那么“医保对医疗支出的影响”就会被收入的差异干扰——我们无法确定支出减少是因为医保,还是因为参保者原本更有钱。只有通过匹配质量评估确认“收入、年龄、健康状况等协变量均平衡”,才能保证因果效应的估计是无偏的。
简言之,没有匹配质量评估的PSM,就像没有质检的产品:即使方法步骤正确,结果的可靠性也无法验证。匹配质量评估不是“额外步骤”,而是因果推断严谨性的必然要求。
二、匹配前的预评估:共同支撑域与倾向得分分布检查
匹配质量评估的第一步,是匹配前的预评估——这是PSM的“前提条件”。如果处理组与控制组的倾向得分没有重叠(即没有共同支撑域),或分布差异过大,后续的匹配将无法消除选择偏差。
(一)共同支撑域的概念与判断方法
共同支撑域是处理组与控制组倾向得分的重叠区域——只有当两组的倾向得分存在重叠时,才能找到“相似”的样本进行匹配。比如,处理组的倾向得分集中在0.6-0.9(即更可能参保),控制组的倾向得分集中在0.1-0.4(即更不可能参保),两者没有重叠,此时无法找到“倾向得分相似”的样本,PSM方法完全不可行。
判断共同支撑域的常用方法是观察倾向得分的分布:通过绘制直方图或核密度图,直观查看两组的倾向得分是否有重叠。比如,处理组的倾向得分直方图峰值在0.7,控制组的峰值在0.3,但两者的尾部有重叠(处理组有部分样本倾向得分0.4-0.6,控制组有部分样本0.5-0.7),那么共同支撑域就是0.5-0.6。对于不在共同支撑域内的样本(如处理组中倾向得分0.8的样本,控制组中0.2的样本),必须剔除——强行保留会导致匹配样本“不相似”,反而引入更大偏差。
共同支撑域是PSM的“红线”:没有共同支撑,就没有匹配的基础。预评估的第一步,就是确认这条“红线”是否存在。
(二)倾向得分分布的预平衡分析
即使存在共同支撑域,处理组与控制组的倾向得分分布仍可能差异过大——比如处理组的倾向得分均值是0.7,方差是0.1;控制组均值是0.3,方差是0.2。这种情况下,即使匹配,也很难让两组的协变量分布一致(因为倾向得分是协变量的压缩,分布差异大意味着协变量整体差异大)。
预平衡分析的目的是在匹配前发现这种问题,及时调整倾向得分的估计方法。比如:
如果倾向得分分布差异大,可能是协变量选择不全(比如遗漏了“健康状况”这个关键变量),需要补充协变量;
或者是倾向得分模型(如逻辑回归)没有捕捉到协变量的非线性关系(比如年龄对参保概率的影响是“先升后降”),需要加入年龄的平方项或交互项;
再或者可以改用机器学习方法(如随机森林)估计倾向得分——这类方法能更好捕捉协变量的复杂关系,让两组的倾向得分分布更接近。
预平衡分析就像匹配前的“体检”:它提前排除“无法通过匹配解决的分布差异”,避免后续工作的无效性。
三、匹配后的平衡检验:协变量分布的同质化评估
匹配后的平衡检验是评估匹配质量的核心——它直接验证“处理组与控制组在匹配后,协变量分布是否一致”。平衡检验分为三个层次:单变量平衡、多变量平衡、个体层面的匹配精度。
(一)单变量平衡检验:均值与方差的比较
单变量平衡检验是“逐个检查”每个协变量的分布
您可能关注的文档
- 2025年咖啡师考试题库(附答案和详细解析)(1220).docx
- 2025年土地估价师考试题库(附答案和详细解析)(1220).docx
- 2025年思科认证网络工程师(CCNP)考试题库(附答案和详细解析)(1223).docx
- 2025年整理收纳师考试题库(附答案和详细解析)(1221).docx
- 2025年智能制造工程师考试题库(附答案和详细解析)(1214).docx
- 2025年注册动画设计师考试题库(附答案和详细解析)(1128).docx
- 2025年注册慈善财务规划师考试题库(附答案和详细解析)(1225).docx
- 2025年注册统计师考试题库(附答案和详细解析)(1226).docx
- 2025年虚拟现实开发工程师考试题库(附答案和详细解析)(1216).docx
- 2025年零信任安全架构师考试题库(附答案和详细解析)(1225).docx
最近下载
- 应用型大学英语视听说教程发展篇2 第四版 Unit 2 Green Business.ppt VIP
- 四川省成都市2024-2025学年高二上期期末统一调研考试 物理 含答案.docx VIP
- T-D-T 1031.5-2011 土地复垦方案编制规程 第5部分:石油天然气(含煤层气)项目(正式版).docx VIP
- 宁波大学2024-2025学年第1学期《高等数学(上)》期末考试试卷(A卷)附参考答案.pdf
- 磷酸、单宁酸混合型带锈转化液的转化效果-材料与测试网.PDF VIP
- 2025年中国高校工商管理硕士MBA教学合格评估方案.docx VIP
- 电动无轨胶轮车安全性设计.docx VIP
- 提高塔内件安装效率的措施分析.pdf VIP
- T∕CEC 151-2018 并网型交直流混合微电网运行与控制技术规范.pdf
- 施乐2056维修手册.pdf VIP
原创力文档


文档评论(0)