断点回归设计(RDD)的操作要点.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

断断点点回回归归设设计计的的操操作作要要点点与与实实施施指指南南

断点回归设计(RegressionDiscontinuityDesign,RDD)是一种准实验研究方法,广泛用于果推断和政策效果评估。其核

心思想是利用制度规则或政策设计中存在的断点(Cutoff),通过比较断点两侧邻近观测值的结局差异来识别果效应。以

下从方法论到实践操作层面展开详细说明:

一一、、RDD的的基基本本原原理理与与适适用用场场景景

断点回归设计的有效性建立在局部随机化假设之上,即在断点附近的小邻域内,个体的分配可视为近似随机。这种设计特别

适用于存在明确阈值规则的政策评估场景,例如:教育领域:高考分数线对大学录取的影响公共政策:贫困线划分对福利获

取的影响医学研究:诊断指标临界值对治疗方案选择的影响经济政策:企业规模阈值对监管强度的差异化处理

核心特征是存在一个连续型分配变量(RunningVariable),其数值决定个体是否接受处理(Treatment)。当分配变量跨越预

设阈值时,处理状态发生突变,形成自然的实验组和对照组。

二二、、数数据据准准备备的的核核心心要要求求

1.分配变量的精确测量必须保证分配变量的测量不存在系统性误差需特别关注可能存在的操纵行为(如学生刻意控制考试

分数靠近录取线)建议绘制分配变量的密度分布图,检验是否存在堆积现象

2.样本分布的连续性要求除处理变量外,其他协变量在断点处应保持连续需预先检验年龄、性别、收入等协变量在阈值两

侧的分布是否均衡

3.带宽选择的科学依据带宽过大会引入混杂素,过小则降低统计功效推荐同时报告多种带宽(如最优带宽的0.5倍、1

倍、1.5倍)的结果

三三、、模模型型设设定定的的关关键键步步骤骤

((1))基基础础模模型型构构建建

对于清晰断点设计(SharRD),基本模型可表示为:[Y_i=\alha+\betaD_i+f(X_ic)+\esilon_i]其中:(D_i=I(X_i

\geqc))为处理指示变量(f(\cdot))为分配变量的函数形式(c)为断点阈值

((2))函函数数形形式式选选择择

多项式回归:需通过交叉验证确定最佳阶数局部线性回归(建议首选):在带宽内使用线性项,配合三角核函数非参数方

法:需注意样本量要求,通常需要较大数据支撑

((3))模模糊糊断断点点处处理理

当存在非完全遵守时(FuzzyRD),需引入工具变量:[D_i=\gamma_0+\gamma_1I(X_i\geqc)+g(X_ic)+u_i]采用两

阶段最小二乘法(2SLS)进行估计,要求工具变量与结果变量无直接关联。

四四、、有有效效性性检检验验的的完完整整流流程程

1.连续性检验检验协变量在断点处的跳跃是否显著建议进行多重检验校正(如Bonferroni校正)

2.密度函数检验使用McCrary检验判断分配变量在阈值处是否存在不连续若0.1需警惕样本操纵可能

3.伪断点检验在非真实断点位置进行安慰剂检验至少选择左右各2-3个伪断点验证结果稳健性

4.模型设定检验比较不同多项式阶数的估计结果检验加入交互项后的系数稳定性

五五、、带带宽宽选选择择的的优优化化方方法法

1.IMSE-最优带宽(ImbensKalyanaraman,2012)基于均方误差最小化的数据驱动方法需注意该方法可能偏向保守估计

2.交叉验证法通过留一法(Leave-one-out)最小化预测误差计算成本较高但结果更稳健

3.适应性带宽根据局部数据密度动态调整带宽特别适用于分配变量分布不均匀的情况

六六、、图图形形化化诊诊断断的的必必要要环环节节

1.原始数据散点图展示分配变量与结果变量的整体关系建议分箱处理并叠加局部回归线

2.条件密度分布图使用核密度估计展示分配变量在阈值两侧的分布辅助识别可能的操纵行为

3.协变量平衡图对关键协变量绘制断点两侧的均值差异使用95%置信区间带增强可视化效果

七七、、结结果果解解释释的的注注意意事事项项

1.局部平均处理效应(LATE)解释明确效应估计仅适用于阈值附近的群体避免直接外推到整体样本

2.政策效应异质性分析检验处理效应是否随分配变量位置变化可通过分样本回归或加入交互项实现

3.经济显著性评估结合标准差和

文档评论(0)

eureka + 关注
实名认证
文档贡献者

好好学习,天天向上

1亿VIP精品文档

相关文档