因果推断中的合成控制法（SCM）案例.docxVIP

下载本文档

0
0
约4.9千字
约 11页
2026-01-12 发布于上海
举报
版权申诉

因果推断中的合成控制法（SCM）案例.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

因果推断中的合成控制法（SCM）案例

一、合成控制法的核心逻辑与基础框架

在社会科学与政策评估领域，“因果关系”始终是最核心的问题——我们想知道一项政策、一个事件或一种干预，到底如何改变了结果。比如，新的教育补贴是否真的提高了学生成绩？环保政策是否降低了空气污染？这些问题的答案不能仅靠“相关性”判断，因为现实中总有各种干扰因素（比如经济发展、社会趋势）混淆因果。而合成控制法（SyntheticControlMethod，SCM）的出现，为解决这一“因果推断难题”提供了一种更精准的工具。它的核心思路，是通过多个控制单元的加权组合，构建一个“虚拟的处理组”，模拟处理组在未接受干预时的状态（即“反事实”），从而分离出干预的净效应。

（一）因果推断的核心挑战：混淆变量与反事实缺失

要理解合成控制法的价值，首先需要明确因果推断的两大难点：

其一，混淆变量的干扰。比如，要评估加州禁烟法案对烟草消费的影响，不能直接比较加州与得州的烟草销量——因为加州的人均收入更高、教育水平更高，这些因素本身就会降低吸烟率，与政策无关。如果控制组（得州）与处理组（加州）在这些“混淆变量”上差异太大，结果差异就无法归因于政策。

其二，反事实的缺失。我们永远无法同时看到“同一处理组接受干预”与“不接受干预”的两种状态。比如，我们能看到加州实施禁烟法案后的烟草销量，但永远看不到“如果加州没实施该法案”的销量——这就是“反事实的不可观测性”，也是因果推断的终极挑战。

传统方法（如双重差分法DID）试图通过“假设控制组与处理组的趋势一致”来解决这个问题，但现实中，很多处理组与单一控制组的特征差异太大，“平行趋势假设”往往不成立。合成控制法的创新，就在于用“多个控制单元的组合”替代“单一控制单元”，让合成组在处理前尽可能贴近处理组，从而更可靠地估计干预效应。

（二）合成控制法的基本思路：构建“虚拟对照”

合成控制法的逻辑可以简化为一句话：用控制组的“加权组合”，模拟处理组的“反事实”。具体来说，它包含三个关键步骤：

选择控制单元：从未接受干预的群体中，挑选一组与处理组特征相近的单元（比如其他州、其他城市）。

计算权重：给每个控制单元分配一个非负权重（权重之和为1），让这些控制单元的加权组合（即“合成组”）在处理前的结果变量（比如处理前的烟草销量）和预测变量（比如人口结构、经济水平）上，尽可能接近处理组。

估计干预效应：处理后，处理组与合成组的结果差异，就是干预的净效应——因为合成组模拟了“处理组未接受干预的状态”。

举个简单的例子：如果我们想评估“某城市的地铁开通对房价的影响”，处理组是“开通地铁的城市A”，控制组是“未开通地铁的城市B、C、D”。我们给B、C、D分配权重（比如B占40%、C占30%、D占30%），让合成组的“处理前房价趋势”“人口密度”“人均收入”与A几乎一致。地铁开通后，A的房价比合成组高10%，这10%就是地铁的因果效应。

二、经典案例：加州《1988年烟草控制法案》的政策效果评估

为了更直观展示合成控制法的操作流程，我们以Abadie、Diamond和Hainmueller的经典研究——加州《1988年烟草控制法案》（Proposition99）的效果评估为例。这个案例不仅是合成控制法的“教科书级应用”，也完美体现了方法的实践价值。

（一）案例背景：政策出台与评估需求

20世纪80年代，加州的吸烟率高于全国平均水平，烟草相关疾病（如肺癌）的死亡率居高不下。1988年，加州通过《1988年烟草控制法案》（Proposition99），核心内容包括：

将每包香烟税提高25美分（用于反吸烟教育和健康研究）；

限制烟草广告；

要求烟草公司公开成分。

政策实施后，加州的烟草销量下降，但争议随之而来：这种下降是政策导致的，还是全国性反吸烟趋势的结果？要回答这个问题，传统方法（如比较加州与得州的销量）无法排除混淆变量（比如加州的经济更发达，健康意识更强），而合成控制法恰好能解决这个问题。

（二）数据准备：变量选择与样本范围

合成控制法的效果，首先取决于数据的质量和变量的选择。在这个案例中，研究团队的操作如下：

结果变量

选择“人均香烟消费量”（单位：包/人/年）作为核心结果变量——这是政策效果的直接衡量指标。数据覆盖1970-1993年（处理前18年，处理后5年），确保有足够的处理前数据拟合合成组。

预测变量（混淆变量）

选择处理前已经存在的变量（避免受政策影响），包括：

1970年的“人口出生率”（影响未来烟民数量，年轻人更易成为新烟民）；

1975年的“人均GDP”（收入高的人更关注健康，烟草消费可能更低）；

1980年的“成人吸烟率”（直接反映基线吸烟水平）；

1985年的“烟草税”（处理前的税价会影响消费量）。

这些变量共同构成了合成组的“特征

您可能关注的文档

文档评论（0）

Coisini + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

因果推断中的合成控制法（SCM）案例.docxVIP