面板数据、工具变量选择和HAUSMAN检验的若干问题及在STATA中的实现.pdfVIP

面板数据、工具变量选择和HAUSMAN检验的若干问题及在STATA中的实现.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面板数据、工具变量选择和HAUSMAN检验的若干问题* 第一节 关于面板数据 PANEL DATA 1、面板数据回归为什么好 一般而言,面板数据模型的误差项由两部分组成,一部分是与个体观察单位有关的, 它概括了所有影响被解释变量,但不随时间变化的因素,因此,面板数据模型也常常被成为 非观测效应模型;另外一部分概括了因截面因时间而变化的不可观测因素,通常被成为特异 性误差或特异扰动项(事实上这第二部分误差还可分成两部分,一部分是不因截面变化但随 时间变化的非观测因素对应的误差项 Vt ,这一部分一般大家的处理办法是通过在模型中引 入时间虚拟变量来加以剥离和控制,另一部分才是因截面因时间而变化的不可观测因素。不 过一般计量经济学的面板数据分析中都主要讨论两部分,在更高级一点的统计学或计量经济 学中会讨论误差分量模型,它一般讨论三部分误差)。 非观测效应模型一般根据对时不变非观测效应的不同假设可分为固定效应模型和随 机效应模型。传统上,大家都习惯这样分类:如果把非观测效应看做是各个截面或个体特有 的可估计参数,并且不随时间而变化,则模型为固定效应模型;如果把非观测效应看作随机 变量,并且符合一个特定的分布,则模型为随机效应模型。 不过,上述定义不是十分严谨,而且一个非常容易让人产生误解的地方是似乎固定效 应模型中的非观测效应是随时间不变的,是固定的,而随机效应模型中的非观测效应则不是 固定的,而是随时间变化的。 一个逻辑上比较一致和严谨,并且越来越为大家所接受的假设是(参见 Wooldridge 的 教材和 Mundlak1978 年的论文),不论固定效应还是随机效应都是随机的,都是概括了那些 没有观测到的,不随时间而变化的,但影响被解释变量的因素(尤其当截面个体比较大的时 候,这种假设是比较合理的)。非观测效应究竟应假设为固定效应还是随机效应,关键看这 部分不随时间变化的非观测效应对应的因素是否与模型中控制的观测到的解释变量相关,如 果这个效应与可观测的解释变量不相关,则这个效应成为随机效应。这也正是 HAUSMAN 设定检验所需要检验的假说。 非观测效应模型因为对非观测效应假设的不同,因为使用面板数据信息的不同,可以 用不同方法来估计并且得到不同的估计量,一般有四个: (1)组内估计量(WITHIN ESTIMATOR )(FE 或 FD: First Difference ) (2 )组间估计量(BETWEEN ESTIMATOR ) (3 )混合OLS 估计量(POOLED OLS ESTIMATOR ) (4 )随机效应估计量(RE ,GLS 或 FGLS 估计量) 这四个估计量因为假设和使用信息的不同而不同,各有优劣势,相互之间也有密切关 系。3 和 4 分别是 1 和 2 的加权平均;4 在特定的假设分别可以转化成 1 和 3 ;如果HAUSMAN 检验表明 4 和 1 没有区别的时候意味着 1 和 2 没有区别。 RE 假设未观察因素与解释变量是正交的,只不过在未观察因素里有两个部分,一是 * 此短文适用于对于面板数据和工具变量已经有初步了解的人士,阅读过中级教材的相关内 容。本文仅供参考,如果存在错误,请与minglu73@263.net联系,以便及时纠正。请原谅中 英文混用。中国科学院的徐志刚博士一一指明了此文存在的错误,并且对原文中存在的不足 作了大量的补充,特表示感谢。 与个体单位有关的,二是完全随机的,RE 在做估计的时候,是用这两个部分的方差计算出 一个指数 λ,来做 quasi-demean,也就是说在去平均的时候是用原值的 y 或 x 减去 λ乘以 y 或 x 的均值,然后用 GLS 估计。极端地,当 λ 为 0 时,非观测效应是一个常数,并且所有 个体都一样,就等价于 Pooled OLS ,当 λ 为 1 时,说明完全随机的部分可以忽略,所有未 观察因素都是与单位有关的,于是就等价于 FE 。但 FE 不需要假定未观察因素与解释变量 是正交的,在做 FE 时,固定效应都被差分掉了,所以也可得到 consistent 的结果。 PANEL 数据的好处之一是,如果未观察到的是固定效应,那么在做 DEMEAN 时,未 观察因素就被差分掉了。这样就可以减少由于未观察的因素可能与解释变量相关而导致的内 生性问题。 2 、那么PANEL 的FE 或 RE 分析就避免了内生性问题吗? 只能说好一些,如果内生的

文档评论(0)

我思故我在 + 关注
实名认证
文档贡献者

部分用户下载打不开,可能是因为word版本过低,用wps打开,然后另存为一个新的,就可以用word打开了

1亿VIP精品文档

相关文档