网站大量收购独家精品文档,联系QQ:2885784924

断点回归设计的有效性检验.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

断断点点回回归归设设计计有有效效性性检检验验的的理理论论与与实实践践

一一、、断断点点回回归归设设计计的的基基本本原原理理与与有有效效性性内内涵涵

断点回归设计(RegressionDiscontinuityDesign,RDD)作为准实验研究法的核心工具,其有效性建立在局部随机化的理论

基础上。该法通过利用政策干预或资格认定的连续性变量阈值(cutoffpoint),比较阈值附近微小区间内实验组与对照组的

差异来估计因果效应。有效性检验的核心目标在于验证三个关键假设:第一,个体无法精确操控驱动变量(assignment

variable);第二,协变量在断点处连续;第三,结果变量在无干预情况下的潜在趋势连续。这三个假设的成立是RDD因果推

断有效性的基石。

二二、、驱驱动动变变量量操操控控性性检检验验

2.1密密度度函函数数连连续续性性检检验验

McCrary(2008)提出的密度检验是检测驱动变量操纵的核心法。具体操作步骤如下:1.将驱动变量划分为等距区间,统

计每个区间的观测值数量2.使用局部线性回归拟合驱动变量的密度函数3.检验断点两侧密度函数的连续性4.通过核密度估计

验证分布形态的平滑性

若检验发现断点处存在显著密度跳跃,可能暗示个体通过策略性行为操纵驱动变量。例如在教育政策中,若分数线附近学生人

数异常聚集,则需警惕自我选择偏误。此时可采用多项式拟合度检验,比较不同阶数多项式对驱动变量分布的拟合效果,判断

是否存在人为堆积。

2.2协协变变量量平平衡衡性性检检验验

有效RDD要求协变量在断点处满足局部平衡性:1.选择与结果变量相关的协变量集2.对每个协变量进行断点回归分析3.检

验处理效应估计值的统计显著性4.计算协变量在断点处的标准化差异

例如在研究奖学金对学业影响时,需验证家庭收入、前期成绩等变量在分数线附近是否均衡分布。若发现协变量存在显著差

异,则可能违反RDD假设。此时可采用双重稳健估计法,将协变量纳入模型进行敏感性分析。

三三、、函函数数形形式式稳稳健健性性检检验验

3.1多多项项式式阶阶数数敏敏感感性性分分析析

模型设定对结果稳健性至关重要:1.从线性到高阶多项式逐步扩展模型2.比较不同阶数下的处理效应估计值3.使用赤池信息

准则(IC)选择最优阶数4.验证高阶项系数统计显著性

建议采用非参数估计作为基准模型,对比参数估计结果。若参数模型与非参数估计差异超过20%,则提示模型设定存在问题。

例如在医疗政策评估中,当使用3次多项式时处理效应为0.15,改用局部线性回归后变为0.12,需深入分析差异来源。

3.2带带宽宽选选择择敏敏感感性性检检验验

带宽选择直接影响估计的偏差-差权衡:1.计算均误差(MSE)最优带宽2.实施交叉验证选择带宽3.进行不同带宽下的

估计值稳定性检验4.使用适应性带宽调整空间异质性

推荐同时报告Imbens-Kalyanaraman最优带宽和覆盖法(covering)带宽的结果。若估计值在±50%带宽范围内保持稳定,可增

强结果可信度。例如当最优带宽为10个单位时,需验证5-15单位带宽下的结果一致性。

四四、、条条件件独独立立性性检检验验

4.1伪伪断断点点检检验验法法((PlaceboTest))

通过构造虚假断点验证模型可靠性:1.在驱动变量实际断点以外的位置设置伪断点2.估计伪处理效应并检验其显著性3.重复

该过程形成伪效应分布4.比较实际效应与伪效应的分布差异

例如在选举研究中,若实际得票率50%处存在效应,而在45%、55%等伪断点处也出现显著效应,则提示存在模型误设。建议

至少设置3个伪断点,且距离真实断点不少于一个带宽单位。

4.2协协变变量量伪伪处处理理效效应应检检验验

验证协变量不应受处理影响的原则:1.选择处理前确定的协变量2.将这些变量作为伪结果变量进行RDD分析3.检验伪处理

效应的统计显著性4.计算伪效应与真实效应的相关性

若发现协变量存在显著伪效应,可能表明驱动变量与协变量存在内生关联。此时需要重新审视研究设计,必要时引入工具变量

进行补充分析。

五五、、结结果果变变量量趋趋势势连连续续性性检检验验

5.1全全局局多多项项式式拟拟合合检检验验

通过高阶多项式检验潜在趋势的连续性:1.拟合包含处理效应的全样本多项式模型2.比较断点两侧多项式系数的结构性变化

3.使用似然比检验判断趋势突变显著性4.验证残差序列的平稳性

例如在环境政策评估中,若污染物浓度在标准值两侧呈现

文档评论(0)

eureka + 关注
实名认证
内容提供者

好好学习,天天向上

1亿VIP精品文档

相关文档