- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析断点回归经济学应用
浅析断点回归经济学应用
摘 要:断点回归(Regression Discontinuity)是仅次于随机实验的,能够有效利用现实约束条件分析变量之间因果关系的实证方法。Thistleth waite和Campbell于1960年正式发表了第一篇关于断点回归的论文。随后Campbell和Stanley为断点回归提供了更加清晰化的概念,在被诸多学者所完善之后,断点回归分析方法被广泛应用于经济学领域。从断点回归的基本模型出发,简要分析断点回归为了使用与经济学而进行的两个变型。
关键词:断点回归;处理效应;经济学应用
中图分类号:F224 文献标志码:A 文章编号:1673-291X(2016)09-0003-02
断点回归首先出现在Thistlethwaite 和 Campbell(1960)关于“对学生的未来学术成果(生涯渴望和研究生项目等级)进行嘉奖”的研究中。其研究表明,奖励根据学生参与测试的成绩进行分配。假设某一学生的分数为X,大于等于一临界值c,便会获得奖励,相反,低于此临界值的学生则享受不到奖励。在这一处理实验(给予奖励)中便会形成一个明显的断点,以函数表达则表现为不连续。用虚拟变量D={0,1}表达处理的收益,即当X≥c时,D=1;当Xc时,D=0。
另外,毋庸置疑的是,除了接受奖励,对于未来学术成果Y也是测试分数的不连续函数。因此,Y在c处的跳跃间断便是受到奖励的因果效应。假设Y和X之间呈现线性关系,方程(1)便简单地表达了对于处理效应τ的简单估计。
Y=α+Dτ+Xβ+ε (1)
ε表示误差项,可看作是Y的值对回归线α+Dτ+Xβ产生的随机误差项。Thistlethwaite 和 Campbell(1960)给出了为什么系数τ可以被看作是受到奖励的效应的估计的一些视觉上的证据(见图1)。假设某一样本的得分X就是c,这一情况下,我们要猜测其收益Y是否为接受了奖励的结果。
假设我们可以认为除了是否奖励,其余因素对于X都是平滑的。则B′可以看作是对得分刚好为c(获得奖励)的样本其收益Y的合理猜测。同理,A′′可以看作是未接受奖励的样本。因此B′- A′′可以看作是因果估计。可见,RD设计应该采用临界点附近的样本作为研究对象,如图1中c′′和c′。
因此理论上来说,样本选取越接近临界点越好。然而在实践过程中,我们???能仅仅考虑临界点附近的样本。所考虑的范围越窄,样本数量就会越少。图1显示,比c′′和c′更加邻近的样本根本不存在。因此,为了充分利用有限的数据,猜测关于X=c时是否获得奖励,我们仍需要距离临界点相比来说有一定距离的样本。如果方程确定为线性,我们便可以用OLS估计获得D的系数τ的最优无偏估计量。
有上述讨论便可以看出RD的两个特点:首先,需要考虑充分能够影响Y的所有因素,而且这些因素对于X而言应该是平滑的。如果另有因素在c处出现跳跃,对于τ(获得奖励的收益)的估计或许是有偏的。另外,因为RD还需要距离临界点较远的数据,因此对于回归方程的选择很重要。本文所讨论的,如果斜率β被错误地限定为0,对于D的OLS估计将得出有偏的结果。
一、RD潜在结果分析框架
当RD被引用为应用经济学中,比如Van der Klaauw(2002),Black(1999),以及Angrist and Lavy(1999),上文提及的识别项在基于Hahn,Todd和Van der Klaauw(2001)的理论上被形式化,其认为RD评估策略运用了有关处理效应文献的相关语言。Hahn,Todd和Van der Klaauw(2001)中指出了RD的关键性假设,所有变量对于X而言应该是连续的,而且如前文提到的一般模型一样对于τ估计的非参数过程不局限在基本的线性问题上。
越来越多的有关“处理效应”的文献通过潜在结果分析框架支持了“连续性假设”的必要性,并通过图表予以辅助说明。对于样本个体i而言,存在了两种潜在的结果,即接受处理得到结果Yi(1)和拒绝处理得到结果Yi(0)。处理的因果效应便可以通过一次差分Yi(1)- Yi(0)获得。
因果推论的基本问题在于,我们不能同时发现一对完美的Yi(1)和 Yi(0)。因此,我们转而关注处理效应的平均值,即Yi(1)- Yi(0)在一组样本上的处理效应而不是单个样本。
关于RD实验的准备,我们假设对于结果和变量X,存在两组对应关系,E[Yi(1)|X]和E[Yi(0)|X](如图2所示)。根据RD实验原理,对于所有位于间断点右侧的样本点(本图中c=2处)选择接受处理而左侧的拒绝处理。因此对于E[Yi(1)|X]我们仅考虑其在c=2右侧的图像,而对于E[Yi(0)|X]我们仅考虑其在c=2左侧的图像。
这就是
文档评论(0)