断点回归设计RDD.docxVIP

下载本文档

43
0
约5.97千字
约 7页
2020-10-27 发布于山东
举报
版权申诉

断点回归设计RDD.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

让“跳跃”更有意义：断点回归设计 (RDD) 原创 2016-09-24 张立龙定量群学在一个高度依赖规则的世界里，有些规则的出现十分随意，这种随意性为我们提供了性质良好的实验（ Angrist Pischke ，2009 ）。断点回归设计（ RegressionDiscontinuity Design ）是一种仅次于随机实验的能够有效利用现实约束条件分析变量之间因果关系的实证方法。 Lee （2008 ）认为在随机实验不可得的情况下，断点回归能够避免参数估计的内生性问题，从而真实反映出变量之间的因果关系。断点回归方法首先是由美国西北大学心理学家 Campbell 于 1958 年提出的；并与 1960 年，与 Thistlethwaite 正式发表了第一篇关于断点回归的论文，提出断点回归是在非实验的情况下处理处置效应（ Treatment Effects ）的一种有效的方法，主要应用于心理学和教育学领域。 1963 年， Campbell and Stanley 为断点回归提供了更加清晰化的概念，但由于当时还缺乏严密的统计证明，加之 IV 方法在处理内生性的思路和范式上具有更广阔的适用范围，因此在随后的几十年间， RD 方法一直没有得到经济学者的重视。直到上世纪90 年代末，随着该方法的理论基础得到进一步发展，大量经济学文献才开始使用 RD 方法对变量之间的因果关系进行识别。断点回归可以分为两类，一类是模糊断点回归（Fuzzy RD ），另一类是清晰断点回归 (Sharp RD) 。清晰断点回归可以看作是一种基于可观察变量进行的选择（selection-on-observablesstory ），而模糊断点回归则常被视为一种工具变量的方法（instrumental-variables-type ）。清晰断点回归 (Sharp RD) 当处理状态是协变量确定型、不连续函数时，可以使用清晰间断点回归法。对于清晰断点回归，个体在临界值的一边接受处理效应（ treatment effect ）的概率为 0 ，而在临界值另一边的概率则为 1 。最早使用清晰断点回归方法的典型例子是：获得国家杰出奖学金的学生是不是会更愿意读研究生 (Thistlewaithe and Campbell,1960; Campbell, 1969) 。清晰断点回归通过比较 PSAT 分数刚好高于或低于国家杰出奖学金分数线的那些高中生的研究生入学率来回答这一问题。一般情况下，在 PAST 考试中得分越高的学生，其将来读研究生的概率也就越大。通过回归来拟合研究生院入学率和 PSAT 之间的关系，可以控制这一趋势，将分数线附近 PSAT 成绩和大学入学率之间的关系中出现的跳跃视为存在处理效应的证据。 Imben and Limieux(2008) 认为断点回归的有效性依赖于我们对协变量的外推，或者至少在协变量有不连续的那个领域内外推，因此，条件期望函数的具体形式的设定很重要。给予具体函数形式得到的断点回归估计值的有效性依赖于多项式模型能否精确的描述条件期望函数。如果不能，那么看上去由于个体被处理而发生的跳跃可能只不过是条件期望函数的某个点的不连续，在设定期望函数之前我们并没有预计到这种不连续。为了使得这种错误降低到最低，断点回归在实际操作中只去考察在不连续点的领域中的数据，也就是考察区间 [x0- △,x0+ △], 其中△为某个很小的正数。换言之，在 x0 左侧和右侧一个足够小领域内比较 Y1i Y0i 的平均值之间的差别，就可估计出处理效应，而这种方法与条件期望函数的具体的形式无关。断点回归估计方法可以分为参数估计和非参数方法的估计。大部分利用断点回归进行的经验研究中，仍然是参数型估计。参数估计方法内涵一个思想是：赋予靠近临界值的数据点更大的权重。随着不连续样本窗口的缩小，断点回归估计值会变得不精确，但是用来模型化函数 f（ xi ）的多项式的阶数也会下降。当以 X0 为中心不断调整样本窗口大小时，控制变量会逐渐变少，但 Di 的处理效应会保持稳定。非参数方法的应用越来越广泛。使用非参数方法对断点回归进行估计时，需要分别对 x0 左侧和右侧领域中的 Yi 的平均值做出精确估计，但这至少会遇到两个问题：如果在临界值很小的领域中进行估计，那么可用的数据就相对较少；在有界领域中对条件期望函数的估计是有偏的。针对这一问题， Hahn, Todd and van der Klaauw 在 2001 年提出了使用非参数的局部线性回归，感兴趣的读者可以进一步阅读。清晰断点回归的一个经典例子是关于执政党地位对其再