网站大量收购独家精品文档,联系QQ:2885784924

因果推断实用计量方法ppt第12章 断点回归.pptx

因果推断实用计量方法ppt第12章 断点回归.pptx

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

邱嘉平第12章:断点回归版权所有@邱嘉平,使用需经授权

大纲断点回归的直观理解断点回归的数据要求RDD的估计步骤RRD运用实例(详细过程见书)版权所有@邱嘉平,使用需经授权

断点回归的直观理解版权所有@邱嘉平,使用需经授权

例:政府针对低收入人群的医疗福利政策?版权所有@邱嘉平,使用需经授权

例:政府针对低收入人群的医疗福利政策图12.1同时观测到每个病人接受治疗和没接受治疗下的健康情况?平均接受治疗的潜在健康结果E(Y(1)|X)=f(X)平均未接受治疗的潜在健康结果E(Y(0)|X)=g(X)版权所有@邱嘉平,使用需经授权

例:政府针对低收入人群的医疗福利政策?版权所有@邱嘉平,使用需经授权

例:政府针对低收入人群的医疗福利政策?图12.2收入低于(高于)50病人接受治疗(没接受治疗)情况下观测到的健康情况?版权所有@邱嘉平,使用需经授权

断点回归要点一:连续性?版权所有@邱嘉平,使用需经授权

断点回归要点二:局部随机性局部随机性是指在断点附近的个体是否接受处置是随机的。本例中,如果某些随机发生的意外收入或支出使得部分病人收入刚好高于或低于50,意味着收入刚好高于50和收入刚好低于50是随机的,导致接受治疗与否也是随机的,从而保证了在断点50左右的病人除了接受治疗与否有差异外,其它的特征没有系统性差异。由于在断点附近局部随机性的特点,断点回归也可被视作一种局部随机实验方法,虽然它使用的是观测数据而非真正的实验数据。版权所有@邱嘉平,使用需经授权

断点回归的数据要求版权所有@邱嘉平,使用需经授权

断点回归的数据要求一断点回归的数据需要包含3个基本变量配置变量(AssignmentVariable),也称作驱动变量(ForcingVariables,RunningVariables):配置变量是个体的一个连续特征变量,匹配变量的值是否大于断点将决定个体是否接受处置。在上节例子中配置变量为收入。断点(cut-point):用于决定个体是否接受处置的阈值。上例中,收入50为断点。观测结果:个体接受处置或未接受处置的观测结果。上例中,个体的观测健康指数为观测结果。版权所有@邱嘉平,使用需经授权

断点回归的数据要求二配置变量的值在断点附近无法被准确操纵。不能被准确操纵的意思是,存在一些随机因素,导致配置变量的值大于或小于断点存在偶然性。本例中,如果有病人为了接受治疗而能够将收入降低到50,或者有病人不愿意接受治疗而能够将收入增加超过50,那么收入稍微低于50的人和收入稍微高于50的人就不是局部随机分配的,可能存在系统性差异,也就不具备可比性。二者观测结果的差异就不能反映处置效应。版权所有@邱嘉平,使用需经授权

断点回归的数据要求三断点的选择不受配置变量的影响。在本例中,如果有个病人收入是52,这个某种原因,政府为了让这位病人接受治疗,将断点设为52,这时断点的选择就受到了配置变量(收入)的影响。这种情况同样造成在断点附近的个体不是局部随机形成的。版权所有@邱嘉平,使用需经授权

断点回归的数据要求四除了处置状态在断点处发生跳跃式变化外,其它未处置前的个体特征变量在断点处没有显著差异。如果其它特征变量在断点处也有显著差异,则观测结果在断点处的变化不一定是由处置状态变化造成的。在上例中,如果收入略低于50的病人比收入略高于50病人在没接受治疗前的锻炼时间也明显多,那么前者在接受治疗后的健康水平比后者高可能是由于前者锻炼时间较多,而非治疗的效果。版权所有@邱嘉平,使用需经授权

RDD的估计步骤和相应STATA命令版权所有@邱嘉平,使用需经授权

RDD的估计步骤一第一步的目的是理解使用RDD方法背后的经济机制,需要回答为什么要使用和为什么能使用RDD方法。具体执行为:(1)讨论配置变量和断点的产生过程,确定配置变量和断点选择是独立的版权所有@邱嘉平,使用需经授权

RDD的估计步骤二第二步的目的是视觉上观察结果变量在断点处是否有明显的跳跃。具体执行为:(2)用散点图显示结果变量和配置变量的关系(twowayscatter)(3)用拟合图显示结果变量和配置变量的关系(rdplot),通常有多项式回归拟合和区间均值拟合两种方法。这两种方法都需要做一些选择。(3.1)多项式回归拟合选择多项式次数(3.2)区间均值拟合选择区间的分割方式(a)按配置变量值平均分割(b)按观测数量平均分割选择区间的数量(a)手动设置(b)选择IMSE最优区间数量(rdbwselect)版权所有@邱嘉平,使用需经授权

RDD的估计步骤三第三步的目的是通过统计方法具体检验数据是否符合使用RDD的前提条件。第三步和第一步是互补的,区别是前者着重从统计角度而后者着重从经济意义论证使用RDD的合理性。具体执行为:统计检验RDD的有效性

文档评论(0)

医药前沿 + 关注
实名认证
内容提供者

专业医药相关文档服务

1亿VIP精品文档

相关文档