浅析断点回归经济学应用.docVIP

下载本文档

40
0
约3.44千字
约 7页
2018-09-11 发布于福建
举报
版权申诉

浅析断点回归经济学应用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

浅析断点回归经济学应用

浅析断点回归经济学应用　　摘要：断点回归（Regression Discontinuity）是仅次于随机实验的，能够有效利用现实约束条件分析变量之间因果关系的实证方法。Thistleth waite和Campbell于1960年正式发表了第一篇关于断点回归的论文。随后Campbell和Stanley为断点回归提供了更加清晰化的概念，在被诸多学者所完善之后，断点回归分析方法被广泛应用于经济学领域。从断点回归的基本模型出发，简要分析断点回归为了使用与经济学而进行的两个变型。　　关键词：断点回归；处理效应；经济学应用　　中图分类号：F224 文献标志码：A 文章编号：1673-291X（2016）09-0003-02 　　断点回归首先出现在Thistlethwaite 和 Campbell（1960）关于“对学生的未来学术成果（生涯渴望和研究生项目等级）进行嘉奖”的研究中。其研究表明，奖励根据学生参与测试的成绩进行分配。假设某一学生的分数为X，大于等于一临界值c，便会获得奖励，相反，低于此临界值的学生则享受不到奖励。在这一处理实验（给予奖励）中便会形成一个明显的断点，以函数表达则表现为不连续。用虚拟变量D={0，1}表达处理的收益，即当X≥c时，D=1；当Xc时，D=0。　　另外，毋庸置疑的是，除了接受奖励，对于未来学术成果Y也是测试分数的不连续函数。因此，Y在c处的跳跃间断便是受到奖励的因果效应。假设Y和X之间呈现线性关系，方程（1）便简单地表达了对于处理效应τ的简单估计。　　Y=α+Dτ+Xβ+ε （1）　　ε表示误差项，可看作是Y的值对回归线α+Dτ+Xβ产生的随机误差项。Thistlethwaite 和 Campbell（1960）给出了为什么系数τ可以被看作是受到奖励的效应的估计的一些视觉上的证据（见图1）。假设某一样本的得分X就是c，这一情况下，我们要猜测其收益Y是否为接受了奖励的结果。　　假设我们可以认为除了是否奖励，其余因素对于X都是平滑的。则B′可以看作是对得分刚好为c（获得奖励）的样本其收益Y的合理猜测。同理，A′′可以看作是未接受奖励的样本。因此B′- A′′可以看作是因果估计。可见，RD设计应该采用临界点附近的样本作为研究对象，如图1中c′′和c′。　　因此理论上来说，样本选取越接近临界点越好。然而在实践过程中，我们???能仅仅考虑临界点附近的样本。所考虑的范围越窄，样本数量就会越少。图1显示，比c′′和c′更加邻近的样本根本不存在。因此，为了充分利用有限的数据，猜测关于X=c时是否获得奖励，我们仍需要距离临界点相比来说有一定距离的样本。如果方程确定为线性，我们便可以用OLS估计获得D的系数τ的最优无偏估计量。　　有上述讨论便可以看出RD的两个特点：首先，需要考虑充分能够影响Y的所有因素，而且这些因素对于X而言应该是平滑的。如果另有因素在c处出现跳跃，对于τ（获得奖励的收益）的估计或许是有偏的。另外，因为RD还需要距离临界点较远的数据，因此对于回归方程的选择很重要。本文所讨论的，如果斜率β被错误地限定为0，对于D的OLS估计将得出有偏的结果。　　一、RD潜在结果分析框架　　当RD被引用为应用经济学中，比如Van der Klaauw（2002），Black（1999），以及Angrist and Lavy（1999），上文提及的识别项在基于Hahn，Todd和Van der Klaauw（2001）的理论上被形式化，其认为RD评估策略运用了有关处理效应文献的相关语言。Hahn，Todd和Van der Klaauw（2001）中指出了RD的关键性假设，所有变量对于X而言应该是连续的，而且如前文提到的一般模型一样对于τ估计的非参数过程不局限在基本的线性问题上。　　越来越多的有关“处理效应”的文献通过潜在结果分析框架支持了“连续性假设”的必要性，并通过图表予以辅助说明。对于样本个体i而言，存在了两种潜在的结果，即接受处理得到结果Yi（1）和拒绝处理得到结果Yi（0）。处理的因果效应便可以通过一次差分Yi（1）- Yi（0）获得。　　因果推论的基本问题在于，我们不能同时发现一对完美的Yi（1）和 Yi（0）。因此，我们转而关注处理效应的平均值，即Yi（1）- Yi（0）在一组样本上的处理效应而不是单个样本。　　关于RD实验的准备，我们假设对于结果和变量X，存在两组对应关系，E[Yi（1）|X]和E[Yi（0）|X]（如图2所示）。根据RD实验原理，对于所有位于间断点右侧的样本点（本图中c=2处）选择接受处理而左侧的拒绝处理。因此对于E[Yi（1）|X]我们仅考虑其在c=2右侧的图像，而对于E[Yi（0）|X]我们仅考虑其在c=2左侧的图像。　　这就是