倾向得分匹配（PSM）在政策评估中的使用.docxVIP

下载本文档

0
0
约4.37千字
约 8页
2025-12-24 发布于上海
举报
版权申诉

倾向得分匹配（PSM）在政策评估中的使用.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

倾向得分匹配（PSM）在政策评估中的使用

引言

政策评估是公共管理领域的核心环节，其核心目标在于准确识别政策实施与预期效果之间的因果关系。然而，现实中政策实施对象往往并非随机分配——例如，某项就业培训政策可能更倾向于覆盖教育水平较低、就业难度较大的群体，这种“自选择”现象会导致直接比较政策接受者（处理组）与未接受者（对照组）的结果时，无法区分差异是由政策本身还是群体固有特征引起的。此时，倾向得分匹配（PropensityScoreMatching,PSM）作为一种能够有效缓解选择偏差的统计方法，逐渐成为政策评估领域的重要工具。本文将围绕PSM的核心逻辑、操作流程、应用优势及实践挑战展开探讨，揭示其在政策评估中的独特价值。

一、PSM的核心逻辑与政策评估需求的契合

（一）政策评估的核心难题：因果推断的选择偏差

政策评估的本质是回答“如果没有该政策，处理组的结果会怎样”这一反事实问题。理想情况下，随机对照试验（RCT）通过随机分配处理组和对照组，确保两组在所有可观测与不可观测特征上的分布一致，从而直接比较结果差异即可得到政策效应。但现实中，由于伦理限制（如无法对患者随机分配某种高风险治疗）、成本约束（如大规模社会政策难以随机实施）或自然选择（如居民自主选择是否参与某政策），RCT往往不可行。此时，观测数据成为主要来源，但观测数据中处理组与对照组的特征通常存在系统性差异：例如，申请创业补贴的企业可能本身就有更强的创新意愿，而未申请的企业可能因资金不足或风险规避而被动“落选”。这种差异会导致传统的均值比较或回归分析高估或低估政策效果，形成“选择偏差”。

（二）PSM的解决思路：通过倾向得分实现“伪随机化”

倾向得分匹配的核心思想是通过构建一个“倾向得分”（即个体接受政策干预的概率），将处理组与对照组中具有相似倾向得分的个体进行匹配，从而在观测数据中模拟随机试验的效果。具体来说，倾向得分是一个综合了所有影响干预分配的协变量（如个体的年龄、教育水平、收入等）的概率值，通过逻辑回归等方法计算得到。匹配后，处理组与对照组在这些协变量上的分布趋于一致，此时两组结果变量的差异即可归因于政策干预本身。例如，在评估某健康保险政策对医疗支出的影响时，PSM会先找出影响居民参保的关键因素（如年龄、收入、健康状况），计算每个居民的参保概率（倾向得分），然后将参保者（处理组）与未参保但倾向得分相近的居民（对照组）配对，最终比较配对后两组的医疗支出差异，这一差异即为政策的净效应。

（三）PSM与政策评估场景的天然适配性

政策评估通常涉及大量异质性个体（如企业、居民、地区），且干预分配受多重因素影响。PSM的优势在于：其一，它通过将多维协变量压缩为单一的倾向得分，解决了“维度灾难”问题——当协变量数量较多时，直接按每个变量匹配会导致匹配对象难以找到；其二，PSM不依赖具体的结果变量模型，仅需对干预分配模型（即倾向得分模型）进行假设，降低了模型误设的风险；其三，PSM的结果易于解释，匹配后的协变量平衡检验（如标准化差异、t检验）能直观展示匹配效果，增强结论的可信度。这些特性使得PSM在教育、医疗、扶贫、环保等领域的政策评估中被广泛应用。

二、PSM在政策评估中的操作流程

（一）第一步：明确评估目标与数据准备

政策评估的首要任务是明确“因果问题”——即要估计的具体政策效应（如平均处理效应ATT、平均处理对处理组的效应ATE等）。例如，若目标是评估“某职业技能培训对参与者收入的影响”，则需明确关注的是“参与培训者相比未参与但类似群体的收入差异”（ATT）。数据准备阶段需收集三类变量：干预变量（是否参与政策）、结果变量（如收入、健康指标）、协变量（影响干预分配的因素，如年龄、教育、行业、地区等）。协变量的选择至关重要，需涵盖所有可能同时影响干预分配和结果变量的“混杂因素”。例如，在评估环保补贴对企业污染排放的影响时，协变量应包括企业规模、行业类型、原有污染水平等，若遗漏“企业环保意识”这一未观测变量，仍可能导致偏差（但PSM无法解决未观测混杂）。

（二）第二步：构建倾向得分模型

倾向得分模型通常采用逻辑回归（Logit）或概率单位模型（Probit），将干预变量（0/1）作为因变量，协变量作为自变量进行估计。模型构建需注意：一是协变量的函数形式，可能需要纳入二次项或交互项以捕捉非线性关系（如年龄对干预概率的影响可能呈倒U型）；二是模型拟合优度的检验，常用的指标包括伪R2、正确预测率等，若模型无法有效区分处理组与对照组（如伪R2过低），则倾向得分的区分度不足，匹配效果可能不佳；三是避免过度拟合，若协变量过多或模型过于复杂，可能导致倾向得分的估计不稳定，需通过逐步回归或理论指导筛选关键变量。例如，在评估“农村电商扶持政策对农户收入的影响”时，协变量可能包括农户的种植规

您可能关注的文档

文档评论（0）

level来福儿 + 关注: 实名认证

文档贡献者

二级计算机、经济专业技术资格证持证人

好好学习

咨询Ta 进入空间

领域认证该用户于2025年09月05日上传了二级计算机、经济专业技术资格证

1亿VIP精品文档

更多 >

倾向得分匹配（PSM）在政策评估中的使用.docxVIP