- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
因果推断中的合成控制法(SCM)案例
一、合成控制法的核心逻辑与基础框架
在社会科学与政策评估领域,“因果关系”始终是最核心的问题——我们想知道一项政策、一个事件或一种干预,到底如何改变了结果。比如,新的教育补贴是否真的提高了学生成绩?环保政策是否降低了空气污染?这些问题的答案不能仅靠“相关性”判断,因为现实中总有各种干扰因素(比如经济发展、社会趋势)混淆因果。而合成控制法(SyntheticControlMethod,SCM)的出现,为解决这一“因果推断难题”提供了一种更精准的工具。它的核心思路,是通过多个控制单元的加权组合,构建一个“虚拟的处理组”,模拟处理组在未接受干预时的状态(即“反事实”),从而分离出干预的净效应。
(一)因果推断的核心挑战:混淆变量与反事实缺失
要理解合成控制法的价值,首先需要明确因果推断的两大难点:
其一,混淆变量的干扰。比如,要评估加州禁烟法案对烟草消费的影响,不能直接比较加州与得州的烟草销量——因为加州的人均收入更高、教育水平更高,这些因素本身就会降低吸烟率,与政策无关。如果控制组(得州)与处理组(加州)在这些“混淆变量”上差异太大,结果差异就无法归因于政策。
其二,反事实的缺失。我们永远无法同时看到“同一处理组接受干预”与“不接受干预”的两种状态。比如,我们能看到加州实施禁烟法案后的烟草销量,但永远看不到“如果加州没实施该法案”的销量——这就是“反事实的不可观测性”,也是因果推断的终极挑战。
传统方法(如双重差分法DID)试图通过“假设控制组与处理组的趋势一致”来解决这个问题,但现实中,很多处理组与单一控制组的特征差异太大,“平行趋势假设”往往不成立。合成控制法的创新,就在于用“多个控制单元的组合”替代“单一控制单元”,让合成组在处理前尽可能贴近处理组,从而更可靠地估计干预效应。
(二)合成控制法的基本思路:构建“虚拟对照”
合成控制法的逻辑可以简化为一句话:用控制组的“加权组合”,模拟处理组的“反事实”。具体来说,它包含三个关键步骤:
选择控制单元:从未接受干预的群体中,挑选一组与处理组特征相近的单元(比如其他州、其他城市)。
计算权重:给每个控制单元分配一个非负权重(权重之和为1),让这些控制单元的加权组合(即“合成组”)在处理前的结果变量(比如处理前的烟草销量)和预测变量(比如人口结构、经济水平)上,尽可能接近处理组。
估计干预效应:处理后,处理组与合成组的结果差异,就是干预的净效应——因为合成组模拟了“处理组未接受干预的状态”。
举个简单的例子:如果我们想评估“某城市的地铁开通对房价的影响”,处理组是“开通地铁的城市A”,控制组是“未开通地铁的城市B、C、D”。我们给B、C、D分配权重(比如B占40%、C占30%、D占30%),让合成组的“处理前房价趋势”“人口密度”“人均收入”与A几乎一致。地铁开通后,A的房价比合成组高10%,这10%就是地铁的因果效应。
二、经典案例:加州《1988年烟草控制法案》的政策效果评估
为了更直观展示合成控制法的操作流程,我们以Abadie、Diamond和Hainmueller的经典研究——加州《1988年烟草控制法案》(Proposition99)的效果评估为例。这个案例不仅是合成控制法的“教科书级应用”,也完美体现了方法的实践价值。
(一)案例背景:政策出台与评估需求
20世纪80年代,加州的吸烟率高于全国平均水平,烟草相关疾病(如肺癌)的死亡率居高不下。1988年,加州通过《1988年烟草控制法案》(Proposition99),核心内容包括:
将每包香烟税提高25美分(用于反吸烟教育和健康研究);
限制烟草广告;
要求烟草公司公开成分。
政策实施后,加州的烟草销量下降,但争议随之而来:这种下降是政策导致的,还是全国性反吸烟趋势的结果?要回答这个问题,传统方法(如比较加州与得州的销量)无法排除混淆变量(比如加州的经济更发达,健康意识更强),而合成控制法恰好能解决这个问题。
(二)数据准备:变量选择与样本范围
合成控制法的效果,首先取决于数据的质量和变量的选择。在这个案例中,研究团队的操作如下:
结果变量
选择“人均香烟消费量”(单位:包/人/年)作为核心结果变量——这是政策效果的直接衡量指标。数据覆盖1970-1993年(处理前18年,处理后5年),确保有足够的处理前数据拟合合成组。
预测变量(混淆变量)
选择处理前已经存在的变量(避免受政策影响),包括:
1970年的“人口出生率”(影响未来烟民数量,年轻人更易成为新烟民);
1975年的“人均GDP”(收入高的人更关注健康,烟草消费可能更低);
1980年的“成人吸烟率”(直接反映基线吸烟水平);
1985年的“烟草税”(处理前的税价会影响消费量)。
这些变量共同构成了合成组的“特征
您可能关注的文档
- 2025年BIM工程师资格认证考试题库(附答案和详细解析)(1230).docx
- 2025年健康评估师考试题库(附答案和详细解析)(1231).docx
- 2025年公关策划师考试题库(附答案和详细解析)(1231).docx
- 2025年注册给排水工程师考试题库(附答案和详细解析)(1228).docx
- 2025年深度学习工程师考试题库(附答案和详细解析)(1230).docx
- 2025年网络安全分析师考试题库(附答案和详细解析)(1225).docx
- 2025年非营利组织管理师考试题库(附答案和详细解析)(1230).docx
- 2025年验光师考试题库(附答案和详细解析)(1229).docx
- 2026年国家公务员考试题库(附答案和详细解析)(0101).docx
- 2026年国际财资管理师(CTP)考试题库(附答案和详细解析)(0101).docx
原创力文档


文档评论(0)