- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1 面板数据
面板数据,即Panel Data,也叫“平行数据”,是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。[1]
其有时间序列和截面两个维度,当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板,所以把panel data译作“面板数据”。但是,如果从其内在含义上讲,把panel data译为“时间序列—截面数据” 更能揭示这类数据的本质上的特点。也有译作“平行数据”或“TS-CS数据(Time Series - Cross Section)”
面板数据从横截面上看,是由若干个体在某一时刻构成的截面观测值,从纵剖面上看,是一个时间序列。
例:
1、城市名:北京、上海、重庆、天津的GDP分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。
如:2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。
2、2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为:
北京市分别为8、9、10、11、12;
上海市分别为9、10、11、12、13;
天津市分别为5、6、7、8、9;
重庆市分别为7、8、9、10、11(单位亿元)。
这就是面板数据。
2 门槛回归模型(阈值回归模型)
(1)模型设置
Hansen(2000) 将“门槛回归”模型的基本形式定义为:
, qi≤γ (1)
, qiγ (2)
其中,作为解释变量的xi是一个m维的列向量。qi被称为“门槛变量”,Hansen(2000)认为门槛变量既可以是解释变量xi中的一个回归元 ,也可以作为一个独立的门槛变量。根据其相应的“门槛值”γ,可将样本分成“两类”(two regimes)。
将模型 (1) (2) 的形式改写成单一方程形式时,首先需要定义一个虚拟变量di(γ)={qi≤γ} ,此处{g}是一个指示函数( indicator function),令集合xi(γ ) = xidi(γ)。因此,模型(1) (2)可写成:
(3)
通过这种添加虚拟变量的方式,可知θ=θ2 ,δn=θ2-θ1。将式(3)进一步改写成矩阵形式:
(4)
此时模型中的回归参数为 (θ,δn,γ) 。在γ给定的前提下,式(4)中的θ和δn是线性关系。因此,根据条件最小二乘估计方法,用Xγ* = [X Xr]对Y回归,得到相应的残差平方和函数如下:
估计得到的门槛值就是使Sn(γ)最小的。被定义为:
(5)
其中,Γn =Γ∩{ q1,…,qn }。Hansen(2000) 将门槛变量中的每一观测值均作为了可能的门槛值,将满足式(5)的观测值确定为门槛值。当门槛估计值确定之后,那么其他参数值也就能够相应地确定。
2. 显著性检验
门槛回归模型显著性检验的目的是,检验以门槛值划分的两组样本其模型估计参数是否显著不同。因此,不存在门槛值的零假设为: H0:θ1 =θ2。同时构造LM统计量:
(6)
其中,S0是在零假设下的残差平方和。由于LM 统计量并不服从标准的分布。因此,Hansen(2000)提出了通过“自举法”(Bootstrap )来获得渐进分布的想法,进而得出相应的概率p值,也称为Bootstrap P值。这种方法的基本思想是:在解释变量和门槛值给定的前提下,模拟(Simulate) 产生一组因变量序列,并使其满足N (0 ,),其中是式(4)的残差项。每得到一个自抽样样本,就可以计算出一个模拟的LM统计量。将这一过程重复1000次,Hansen(1996)认为模拟产生的LM统计量大于式(6)的次数占总模拟次数的百分比就是“自举法”估计得到的P值。这里的Bootstrap P值类似于普通计量方法得出的相伴概率P值。例如,当 Bootstrap P值小于0.01时,表示在1 %的显著性水平下通过了LM检验,以此类推。
3.置信区间
当确定某一变量存在“门槛效应”时,还需要进一步确定其门槛值的置信区间。即对零假设 H0 : 进行检验,“似然比统计量”( Likelihood Ratio Statistic)可表示为:
原创力文档


文档评论(0)