拐点回归设计RKD概览, 及其开展实证研究的经典示例

凡是搞计量经济的，都关注这个号了

稿件：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

以下链接指向诺奖男神邀你“分析COVID-19危机的短期,中期和长期影响的经济方法”的官方录制视频，未能观看直播的速速前往该地址观看：
https://zoom.com.cn/rec/play/6Jd-cu-o_Gk3H4KQ4gSDVqV-W42_f6qs1iVK_6dcnkrjVHAHZFOlZbsTNuZvhL9dkN58hnQqx39kMtLo?continueMode=true&tokenMeetingId=4px8F7GztWhJYtLD4mXBHe0cE77Xaaa81CEfr6IIyRmeGLmm4dmXW-E-2zWqxJIj&_x_zm_rtaid=9tYTISU7SQ68s4SOoNsdZQ.1586443552375.5e326771e769554ac136fcdf745f3f9c&_x_zm_rhtaid=18
关于一些计量方法的合辑，各位学者可以参看如下文章：①“实证研究中用到的200篇文章, 社科学者常备toolkit”、②实证文章写作常用到的50篇名家经验帖, 学者必读系列、③过去10年AER上关于中国主题的Articles专辑、④AEA公布2017-19年度最受关注的十大研究话题, 给你的选题方向，⑤2020年中文Top期刊重点选题方向, 写论文就写这些。后面，咱们又引荐了①使用CFPS, CHFS, CHNS数据实证研究的精选文章专辑！，②这40个微观数据库够你博士毕业了, 反正凭着这些库成了教授，③Python, Stata, R软件史上最全快捷键合辑！，④关于(模糊)断点回归设计的100篇精选Articles专辑！，⑤关于双重差分法DID的32篇精选Articles专辑！，⑥关于合成控制法SCM的33篇精选Articles专辑！⑦最近80篇关于中国国际贸易领域papers合辑！，⑧最近70篇关于中国环境生态的经济学papers合辑！⑨使用CEPS, CHARLS, CGSS, CLHLS数据库实证研究的精选文章专辑！⑩最近50篇使用系统GMM开展实证研究的papers合辑！

正文

关于下方文字内容，作者：王雨舟，美国威斯康星大学麦迪逊分校计量经济学，通信邮箱：wang2555@wisc.edu

今天，我们主要介绍一下regression Kink design(拐点回归设计)，与其紧密相关的是regression discontinuity design(断点回归设计)。
关于断点回归设计，各位可以参看：1.断点回归设计RDD分类与操作案例，2.RDD断点回归, Stata程序百科全书式的宝典，3.断点回归设计的前沿研究现状, RDD，4.断点回归设计什么鬼？且听哈佛客解析，5.断点回归和读者的提问解答，6.断点回归设计RDD全面讲解, 教育领域用者众多，7.没有工具变量、断点和随机冲击，也可以推断归因，8.找不到IV, RD和DID该怎么办? 这有一种备选方法，9.2卷RDD断点回归使用手册, 含Stata和R软件操作流程，10.DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征，11.安神+克拉克奖得主的RDD论文, 断点回归设计，12.伊斯兰政府到底对妇女友不友好？RDD经典文献，13.PSM,RDD,Heckman,Panel模型的操作程序，14.RDD经典文献, RDD模型有效性稳健性检验，15.2019年发表在JDE上的有趣文章, 计量方法最新趋势
1. 实证分析工具：拐点回归设计概览
断点回归模型工具RDD已成为当下流行的影响力评估工具的补充，它能够以一种视觉效果突出的方式来展现研究对象在临界值附近的影响。而作为这种方法的扩展，回归拐点设计（RKD）的运用愈见广泛。我从未使用过这些方法进行估计，也不是这方面的专家，但我认为对这种方法进行介绍，提供一些可以后续参考的文章链接可能对需要使用此方法的人很有帮助。
基本概念
断点回归设计利用的是在干预可能性临界值点的跳跃或者不连续性。而在拐点回归设计中，被干预可能性的斜率在拐点发生了变化，从而导致赋值函数的一阶导不连续。这类拐点在众多政策中屡见不鲜。例如Simonsen et al. (2015)在丹麦政府的处方药报销时间表中使用了拐点法：补贴基于个人当年支付的处方总费用；前500丹麦克朗的费用补贴为0％，在支付500克朗到1200克朗之间补贴50％，随后是75％的补贴，最后支付超过2800丹麦克朗以上费用时将补贴80％。结果是零用钱支付的价格份额如图1所示：

图1：Y轴是实际支付的价格份额。下降幅度接近500丹麦克朗，因为如果您花了480并以50克朗的价格买了东西，则您支付的20克朗部分补贴为0%，超出临界值的30克朗部分则以50％计算补贴
第二个例子是政府的失业保险金支付，该支付在最高额度限制下通常可以覆盖之前工资的一定比例，有时也有下限。例如Landais最近的一篇论文，在图2中绘制了路易斯安那州的失业救济金关于季度最高收入的函数：

其后，研究探查结果变量关于运行变量的扭折/斜率变化是否在同一点发生。例如，兰代斯（Landais）对人们在失业中花费的时间长短与所获得的福利金额的关系感兴趣。下面的图3显示了在这个拐点处，失业时间关于最高季度收入的函数斜率在拐点处发生了很大变化。

图3：结果变量与干预变量的拐点在同一处
随后可通过将结果变量的斜率变化除以干预变量的斜率变化来得到因果影响。当政策规则实施时出现错误时，可以使用模糊RKD设计（请参阅 Card et al. (2015)）
估计
可以通过使用多项式回归来估计。令x为运行变量（例如，前一个季度最高的收入），Y为结果变量（例如，失业时间）；k为拐点，D是一个虚拟变量，位于拐点的右侧。然后估算：
Y = a0 + a1 （x-k）+ b1 D （x-k）+ a2 （x-k）^ 2 + a3 D （x-k）^ 2 +…
其中b1展现了拐点处结果变量关于运行变量斜率的变化。
运行相同的回归以获得干预变量关于运行变量在拐点处的斜率变化，并取两个系数的比值。
标准差可以通过Delta方法来得到。估计也可以通过非参数局部多项式完成。
关键的假设和检验
拐点回归的假设类似于断点回归，同时以类似方式进行检验：
1.其他协变量在拐点处的斜率应当没有变化（例如，Landais展示在拐点处的年龄，教育程度，资本收入或受抚养者数量在拐点处没有斜率变化）

2.在拐点没有对赋值变量的操纵-例如在失业情况下，人们不会因其对未来失业福利对影响而策略性地瞒报过去的收入。这可以通过McCrary型测试进行测试，该测试表明赋值变量的分布在拐点处是连续的，并且此概率密度分布函数的一阶导数也很平滑。Card et al. (2015) 表明，只要样本对象在最优化时的误差或错误很小以至于分拣不是完全确定的，您就可以允许对象围绕拐点进行一些非随机拣选。

3.本文建议您可以在非拐点进行一些安慰剂测试。

技术细节可以Econometrica paper by Card et al. (2015)中找到。
注意事项
RKD设计在小样本中的表现可能很差，且通常需要比RDD更大的带宽或者更大的样本量。
有一些方法可以有效地选择最佳带宽，但无法论证这一选择相较于其他潜在选择是最佳的抑或无法验证其稳健性的论文将面临批评。有关示例，请参见对此AEJ经济政策论文的评论。
2.使用拐点回归设计的实证例子：评估失业的福利影响
与断点回归（RDD）相类似，拐点回归（RKD）以突出的视觉效果和对市场因素变化的可控性而受到当今学者的关注，尤其适用于福利政策相关的因果效应研究。但与此同时，该模型也存在一定的局限性，对赋值变量和协变量的关系以及样本有一定要求：

首先，需要找到合适的赋值变量（例如保险金额与收入成线性相关并具有上下限），从而能够定义拐点；
除目标变量外的协变量在拐点附近的斜率不应有显著变化（如年龄、教育程度等等）；
赋值变量在拐点处的分布应是连续且一阶平滑的，也就是说样本不会在拐点处操纵赋值变

量（例如人们不会因为达到最高限额而瞒报收入）；

RKD受小样本局限性影响较大，需要比RDD更大的带宽；
RKD仅能估计拐点附近的因果效应，无法简单地推广至总体。

Landais(2015)通过清晰拐点回归模型研究了失业保险政策在金额和持续时间方面的变动对劳动力供给的影响。作者认为当下大部分关于失业保险研究的数据来源于各州基于时间变化的法律法规变动，因此难以解决劳动市场情况的内生性问题，也难以控制市场波动随时间的变化。本文中所使用的方法可以有效规避这个问题，也就是在RKD设计拐点处的小区间内可以认为市场因素是几乎不变的，且无需传统回归模型的假设。研究者通过RK方法可以识别同一个劳动者在恒定市场环境下对保险金金额和持续时间变化的行为反应。我们所熟知的RDD模型是利用赋值规则在断点的不连续性，而RKD着眼于政策相关变量与赋值变量的关系在拐点附近的变化，也就是说不再对截距而是对斜率变化进行估计。
Landais(2015)的数据来源于Continuous Wage and Benefit History Project (CWBH)，其中包含美国从1970年代晚期至1984年5个州的失业期记录。本文中的RKD设计基于失业保险UI的发放特点。首先，UI领取时间不得超出其上限，一般是26星期。与此同时，总金额也不得超出由最高季度收入决定的上限金额。文中图2展示了路易斯安那州每周失业救济金作为最高季度收入的函数：

图三展示了潜在持续期随最高季度收入变动的函数：
以上两图中均可以看出明显的拐点变化，且该拐点随不同年份或不同项目的政策而变动。接下来，Landais观察到他所感兴趣的变量比如失业持续时间在同样的拐点两端出现斜率变化，如下图：

作者以此为基础建立RKD模型：短期保险金额在低于上限Bmax的情况下等于最高季度收入乘以一个常数（呈线形变化），以是否高于上限为界限进行分析；同理，在收益时间方面作者也以是否达到上限Dmax为拐点进行分析。在拐点两边分别作线性回归后，将两端斜率相除得到各州的因果效应ATET。
Landais通过描述性统计发现，各州UI的宽容程度有较大差异，但总体架构在数据集所统计的30年间几乎没有变化。这说当今收入分布的拐点在和数据覆盖期间相近的位置，为研究当下UI最优政策带来便利。然而，想要将该实证模型作为UI政策制定的参考标准，仍需要分析并检验该模型的有效性。
本文中的清晰拐点回归（sharp RK）设计基于两个基本假设：首先，赋值变量关于结果变量的直接边际效应应当是平滑的；其次，异质性的密度在拐点随赋值变量的变化也应当是平滑的。作者认为因为很少有人在任职时会关注UI的日程，所以假设是可信的。如果UI占有率导致了非随机性分配，那么RKD的有效型也会受到影响。CWBH提供了证据证实占有率不足主要是信息不足导致的，所以第二个假设也可以得到支持。然而除此之外，我们必须能够持续掌握被调查者被解雇前和被解雇后的UI情况并及时掌握他的离职日期。
作者采用多种方法进行了辅助分析来验证RKD的有效性。首先，它利用McCrary 方法对概率密度函数的不连续性进行检验，并对一阶导数的连续性进行检验。随后又通过图像展示了协变量在拐点处的平滑性。

样本数量在赋值变量分界点处无断点，而协变量如年龄、教育年限、因变量数量在拐点处平滑，符合RKD的基本假设。随后，作者对RKD稳健性进行了多重检验。首先，其估计值在线性、二次和三次多项式假设下没有显著差异。针对前文提及的结果变量（outcome variable）与强制变量（forcing variable）相关性问题，也就是RKD估计值可能只是由最高季度收入和结果变量间的相关关系导致而与提高UI宽容度无关，Landais进行了双差RKD分析和安慰剂分析。双差分析利用了不同时期拐点位置的差异。下图可看出，1979年的样本数据在1982年的拐点处无显著斜率变化，1982年的数据在1979拐点处也无显著变化，而两拐点间的拟合斜率在两年间发生了明显改变。

安慰剂分析中，作者将主要分析中的结果变量替换为不会被处理（treatment）所影响的“伪结果” 后，并未观测到主要分析中的显著结果。两种检验方法均验证了RKD在本研究中的稳健性。
在失业险支付期限方面，作者主要关注支付期限、主张失业期限、初始失业期限三个方面。下图展示了利用RKD方法对不同时期路易斯安那州UI金额对三种失业期影响的估计结果。估计表明，Ɛb是失业期关于津贴金额的弹性估计，其估计值依赖于不同周期在0.2至0.7的区间范围内。而对回归系数的估计表明，每周津贴额增加10% 将导致失业时长延长2-7%，此数值对于三种不同期限计算方法具有一致性。

在对五个州和不同时期分别进行RKD估计后，作者发现失业期相对于福利水平的弹性估计值始终在0.1到0.7之间，而所有5个州和不同时期共26个估计的平均初始持续时间弹性为0.32。此外，对路易斯安那州的估计还显示，UI的期限每增加一周失业将增加0.2至0.4周，与以前其他学术研究的估计结论相符。最后，作者对华盛顿进行了单独的RKD估计（因为只有华盛顿可以通过匹配UI和工资记录来获取非雇用时长信息）计算流动性和道德影响的比重为88%，比Chetty(2008) 的结果小。
总体而言，RKD在对UI的政策研究中有很大优势。由于此方法仅仅依赖于收益的时间变化和个体的一阶条件，它也普遍适用于其他收益随时间变化的项目。另外，本篇中所使用的方法有利于政府机构在面临较小保险政策调整情况下，能够更迅速地找到最优策略。然而，在劳动力市场的均衡搜索与匹配模型中，仅对劳动力供给对UI的反应不足以计算保险与道德风险之间的最佳权衡，而需要估计雇佣均衡的变动。因此，更加准确而清晰地估计两种不同影响并进行权衡不失为今后有价值的研究方向之一。

长按以上二维码, 阅读英文原文PDF

Reference：Landais, Camille. 2015. "Assessing the Welfare Effects of Unemployment Benefits Using the Regression Kink Design." American Economic Journal: Economic Policy, 7 (4): 243-78.**

Source: https://blogs.worldbank.org/impactevaluations/tools-trade-regression-kink-design

拓展性阅读：

①关于各种因果识别方法的120份经典实证文献汇总”，②哈佛大学新修订完成的因果推断经典大作免费下载！附数据和code，③因果推断的统计方法总结, 177份文献，④政策评估的计量方法综述, 包括最新因果推断方法，⑤在教育领域使用IV, RDD, DID, PSM多吗? 使用具体文献，⑥看完顶级期刊文章后, 整理了内生性处理小册子，⑤工具变量精辟解释, 保证你一辈子都忘不了，⑦DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征，⑧关于双重差分法DID的32篇精选Articles专辑！⑨关于(模糊)断点回归设计的100篇精选Articles专辑！⑩匹配方法(matching)操作指南, 值得收藏的16篇文章等，⑪MIT广为流传的政策"处理效应"读本，⑫DID的研究动态和政策评估中应用的文献综述，⑬最新政策效应评估的四种方法，⑭政策效应评估的基本问题。

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。
2.5年，计量经济圈近1000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

更多相关文章

随机推荐