- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
倾向得分匹配(PSM)在政策评估中的使用
引言
政策评估是公共管理领域的核心环节,其核心目标在于准确识别政策实施与预期效果之间的因果关系。然而,现实中政策实施对象往往并非随机分配——例如,某项就业培训政策可能更倾向于覆盖教育水平较低、就业难度较大的群体,这种“自选择”现象会导致直接比较政策接受者(处理组)与未接受者(对照组)的结果时,无法区分差异是由政策本身还是群体固有特征引起的。此时,倾向得分匹配(PropensityScoreMatching,PSM)作为一种能够有效缓解选择偏差的统计方法,逐渐成为政策评估领域的重要工具。本文将围绕PSM的核心逻辑、操作流程、应用优势及实践挑战展开探讨,揭示其在政策评估中的独特价值。
一、PSM的核心逻辑与政策评估需求的契合
(一)政策评估的核心难题:因果推断的选择偏差
政策评估的本质是回答“如果没有该政策,处理组的结果会怎样”这一反事实问题。理想情况下,随机对照试验(RCT)通过随机分配处理组和对照组,确保两组在所有可观测与不可观测特征上的分布一致,从而直接比较结果差异即可得到政策效应。但现实中,由于伦理限制(如无法对患者随机分配某种高风险治疗)、成本约束(如大规模社会政策难以随机实施)或自然选择(如居民自主选择是否参与某政策),RCT往往不可行。此时,观测数据成为主要来源,但观测数据中处理组与对照组的特征通常存在系统性差异:例如,申请创业补贴的企业可能本身就有更强的创新意愿,而未申请的企业可能因资金不足或风险规避而被动“落选”。这种差异会导致传统的均值比较或回归分析高估或低估政策效果,形成“选择偏差”。
(二)PSM的解决思路:通过倾向得分实现“伪随机化”
倾向得分匹配的核心思想是通过构建一个“倾向得分”(即个体接受政策干预的概率),将处理组与对照组中具有相似倾向得分的个体进行匹配,从而在观测数据中模拟随机试验的效果。具体来说,倾向得分是一个综合了所有影响干预分配的协变量(如个体的年龄、教育水平、收入等)的概率值,通过逻辑回归等方法计算得到。匹配后,处理组与对照组在这些协变量上的分布趋于一致,此时两组结果变量的差异即可归因于政策干预本身。例如,在评估某健康保险政策对医疗支出的影响时,PSM会先找出影响居民参保的关键因素(如年龄、收入、健康状况),计算每个居民的参保概率(倾向得分),然后将参保者(处理组)与未参保但倾向得分相近的居民(对照组)配对,最终比较配对后两组的医疗支出差异,这一差异即为政策的净效应。
(三)PSM与政策评估场景的天然适配性
政策评估通常涉及大量异质性个体(如企业、居民、地区),且干预分配受多重因素影响。PSM的优势在于:其一,它通过将多维协变量压缩为单一的倾向得分,解决了“维度灾难”问题——当协变量数量较多时,直接按每个变量匹配会导致匹配对象难以找到;其二,PSM不依赖具体的结果变量模型,仅需对干预分配模型(即倾向得分模型)进行假设,降低了模型误设的风险;其三,PSM的结果易于解释,匹配后的协变量平衡检验(如标准化差异、t检验)能直观展示匹配效果,增强结论的可信度。这些特性使得PSM在教育、医疗、扶贫、环保等领域的政策评估中被广泛应用。
二、PSM在政策评估中的操作流程
(一)第一步:明确评估目标与数据准备
政策评估的首要任务是明确“因果问题”——即要估计的具体政策效应(如平均处理效应ATT、平均处理对处理组的效应ATE等)。例如,若目标是评估“某职业技能培训对参与者收入的影响”,则需明确关注的是“参与培训者相比未参与但类似群体的收入差异”(ATT)。数据准备阶段需收集三类变量:干预变量(是否参与政策)、结果变量(如收入、健康指标)、协变量(影响干预分配的因素,如年龄、教育、行业、地区等)。协变量的选择至关重要,需涵盖所有可能同时影响干预分配和结果变量的“混杂因素”。例如,在评估环保补贴对企业污染排放的影响时,协变量应包括企业规模、行业类型、原有污染水平等,若遗漏“企业环保意识”这一未观测变量,仍可能导致偏差(但PSM无法解决未观测混杂)。
(二)第二步:构建倾向得分模型
倾向得分模型通常采用逻辑回归(Logit)或概率单位模型(Probit),将干预变量(0/1)作为因变量,协变量作为自变量进行估计。模型构建需注意:一是协变量的函数形式,可能需要纳入二次项或交互项以捕捉非线性关系(如年龄对干预概率的影响可能呈倒U型);二是模型拟合优度的检验,常用的指标包括伪R2、正确预测率等,若模型无法有效区分处理组与对照组(如伪R2过低),则倾向得分的区分度不足,匹配效果可能不佳;三是避免过度拟合,若协变量过多或模型过于复杂,可能导致倾向得分的估计不稳定,需通过逐步回归或理论指导筛选关键变量。例如,在评估“农村电商扶持政策对农户收入的影响”时,协变量可能包括农户的种植规
您可能关注的文档
- 继承法新变化指南.docx
- 脑机接口的侵入式与非侵入式对比.docx
- 自适应学习系统设计.docx
- 行为金融处置效应对持仓影响.docx
- 诈骗罪认定及数额标准最新规定.docx
- 课堂专注度的EEG实时反馈装置.docx
- 调岗协商的法定程序与要求.docx
- 财务审计咨询协议.docx
- 资产定价CAPM模型实证检验.docx
- 资产管理计划协议.docx
- 2026年企业增值税期末留抵税额结转技巧与税务处理规范.pptx
- 2026年经销商大会方案设计与渠道凝聚力提升.pptx
- 便携式蓝牙键盘折叠款推广方案(折叠便携+多设备适配+职场学生适配).pptx
- 小学四年级语文文言文入门启蒙专项讲义.pptx
- 2026年电子会计档案管理系统搭建与档案利用效率提升.pptx
- 2026年区域供应链标准制定方案与企业地方供应链适配性提升手册.pptx
- 2026年企业财务报表编制与分析实战手册.pptx
- 高中高二英语短文改错时态专项讲义.pptx
- 2026年生产安全隐患排查方案与企业事故风险提前规避指南.pptx
- 2026年企业并购重组策略制定与整合效果提升指南.pptx
原创力文档


文档评论(0)