- 1、本文档共22页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
倾向值匹配与因果推论
社会学研究
倾向值匹配与因果推论:
方法论述评∗
胡安宁
提要提要:社会科学对于因果关系的关注使得倾向值匹配 (Propensity Score
提要提要
Matching )的方法受到越来越多的重视。本文从以下几个方面对这一方法进
行述评。首先,本文系统梳理了倾向值匹配方法的历史、发展及其对于社会
学调查研究的意义。其次,通过一个具体实例,本文展示了倾向值匹配的具
体实施过程。第三,从密尔对因果关系的论述以及统计学的反事实框架
(Counterfactual Framework )出发,本文阐释了倾向值匹配如何通过“控制”
混淆变量从而满足非混淆假设 (Unconfoundedness )来帮助研究者提出因果
性结论。第四,本文将倾向值匹配和回归中断设计和工具变量进行了比较。
最后,在简要分析倾向值匹配的局限性之后,本文讨论了倾向值匹配的最新
发展趋势。
关键词关键词: 因果推论 倾向值匹配 控制思想 反事实框架
关键词关键词
在过去十几年中,社会科学领域中一个重要的方法论突破在于开
始关注如何通过严格的统计技术进行因果推论(Sobel,1995,1996,2000;
Morgan Winship,2007 ;Winship Morgan,1999 ;Winship
Sobel,2004) 。在各种统计学方法中,倾向值匹配 (Propensity Score
Matching )受到越来越多的重视,并在教育学、传染病学以及社会学
等领域得到了广泛的应用 (Harding ,2003 ;Morgan,2001 ;Morgan
Harding,2006 ;Normand et al. ,2001 ;Smith,1997)。
相对于经济学的工具变量方法,倾向值匹配在社会科学研究中还
是一个新兴的统计技术。然而,随着越来越多的经验研究开始关注并
且应用倾向值匹配,其独特的优势也逐渐展现出来,因此有着极为广
阔的应用前景。本文将从六个方面系统介绍这一方法。在第一部分,
∗ 作者感谢复旦大学社会学系周怡教授和北京大学社会学系方文教授的建议和帮助, 并感谢匿
名审稿人所提出的修改意见。文责自负。
1
社会学研究
笔者将讨论倾向值匹配的历史、发展以及它对社会学调查研究的意
义。第二部分将通过一个具体实例来展示倾向值匹配的具体实施过
程。在第三部分,笔者将从科技哲学和统计学两个方面讨论为什么倾
向值匹配的结果可以进行因果性解读。第四部分将把倾向值匹配与其
它比较常用的因果推论方法进行简要对比并由此展示倾向值匹配相
对于其它方法所特有的优势。在第五部分,笔者将探讨倾向值匹配所
存在的一些局限性。最后,简要总结本文内容并探讨倾向值匹配的最
新发展趋势。
一、倾向值匹配: 历史、发展及其对调查研究的意义
倾向值 (Propensity Score )这个概念最早出现在 1983 年罗森鲍姆
(Rosenbaum )和鲁宾 (Rubin )合写的一篇名为 《倾向值对于观察研
究中因果效应的中心作用》的论文中 (Rosenbaum Rubin,1983)。
倾向值指被研究的个体在控制可观测到的混淆变量 (Confounding
Variables )的情况下受到某种自变量影响的条件概率。在一般的实证
研究中,由于存在很多其他变量来混淆自变量和因变量之间的关系,
研究者很难直接探索二者之间的“净效果(Net Effects)” 。例如,大学教
育的收入回报可能受到年龄、性别以及地区差异这些混淆变量的影
响。因此,上大学的人的平均收入与没有上大学的人的平均收入的差
异有可能也反映了混淆变量的作用。这些混淆变量的影响通常被称为
选择性误差 (Selection Bias),而通过倾向值匹配的方式来控制和消除
选择性误差则是罗森鲍姆和鲁宾论文的题中之义。罗森鲍姆和鲁宾用
数理方法证明:通过将这些混淆变量纳入 Logis
文档评论(0)