门槛回归（阈值回归）.docVIP

下载本文档

26
0
约2.27千字
约 2页
2020-01-24 发布于江西
举报
版权申诉

门槛回归（阈值回归）.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

1 面板数据面板数据，即Panel Data，也叫“平行数据”，是指在时间序列上取多个截面，在这些截面上同时选取样本观测值所构成的样本数据。[1] 其有时间序列和截面两个维度，当这类数据按两个维度排列时，是排在一个平面上，与只有一个维度的数据排在一条线上有着明显的不同，整个表格像是一个面板,所以把panel data译作“面板数据”。但是,如果从其内在含义上讲,把panel data译为“时间序列—截面数据” 更能揭示这类数据的本质上的特点。也有译作“平行数据”或“TS-CS数据（Time Series - Cross Section）” 面板数据从横截面上看，是由若干个体在某一时刻构成的截面观测值，从纵剖面上看，是一个时间序列。例： 1、城市名：北京、上海、重庆、天津的GDP分别为10、11、9、8（单位亿元）。这就是截面数据，在一个时间点处切开，看各个城市的不同就是截面数据。如：2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12（单位亿元）。这就是时间序列，选一个城市，看各个样本时间点的不同就是时间序列。 2、2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为：北京市分别为8、9、10、11、12；上海市分别为9、10、11、12、13；天津市分别为5、6、7、8、9；重庆市分别为7、8、9、10、11（单位亿元）。这就是面板数据。 2 门槛回归模型（阈值回归模型）（1）模型设置 Hansen(2000) 将“门槛回归”模型的基本形式定义为: , qi≤γ (1) , qiγ (2) 其中，作为解释变量的xi是一个m维的列向量。qi被称为“门槛变量”，Hansen(2000)认为门槛变量既可以是解释变量xi中的一个回归元 ,也可以作为一个独立的门槛变量。根据其相应的“门槛值”γ,可将样本分成“两类”(two regimes)。将模型 (1) (2) 的形式改写成单一方程形式时,首先需要定义一个虚拟变量di(γ)={qi≤γ} ,此处{g}是一个指示函数( indicator function)，令集合xi(γ ) = xidi(γ)。因此，模型(1) (2)可写成： (3) 通过这种添加虚拟变量的方式,可知θ=θ2 ,δn=θ2-θ1。将式(3)进一步改写成矩阵形式: (4) 此时模型中的回归参数为 (θ,δn,γ) 。在γ给定的前提下，式(4)中的θ和δn是线性关系。因此,根据条件最小二乘估计方法，用Xγ* = [X Xr]对Y回归，得到相应的残差平方和函数如下：估计得到的门槛值就是使Sn(γ)最小的。被定义为: (5) 其中，Γn =Γ∩{ q1,…,qn }。Hansen(2000) 将门槛变量中的每一观测值均作为了可能的门槛值，将满足式(5)的观测值确定为门槛值。当门槛估计值确定之后,那么其他参数值也就能够相应地确定。 2. 显著性检验门槛回归模型显著性检验的目的是，检验以门槛值划分的两组样本其模型估计参数是否显著不同。因此，不存在门槛值的零假设为: H0:θ1 =θ2。同时构造LM统计量： (6) 其中，S0是在零假设下的残差平方和。由于LM 统计量并不服从标准的分布。因此，Hansen(2000)提出了通过“自举法”(Bootstrap )来获得渐进分布的想法，进而得出相应的概率p值，也称为Bootstrap P值。这种方法的基本思想是：在解释变量和门槛值给定的前提下，模拟(Simulate) 产生一组因变量序列，并使其满足N (0 ,)，其中是式(4)的残差项。每得到一个自抽样样本，就可以计算出一个模拟的LM统计量。将这一过程重复1000次，Hansen(1996)认为模拟产生的LM统计量大于式(6)的次数占总模拟次数的百分比就是“自举法”估计得到的P值。这里的Bootstrap P值类似于普通计量方法得出的相伴概率P值。例如，当 Bootstrap P值小于0.01时，表示在1 %的显著性水平下通过了LM检验，以此类推。 3.置信区间当确定某一变量存在“门槛效应”时，还需要进一步确定其门槛值的置信区间。即对零假设 H0 : 进行检验，“似然比统计量”( Likelihood Ratio Statistic)可表示为：