- 1、本文档共36页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高级计量经济学面板数据模型推荐
第三章面板数据模型
(Models for panel data)
2
本章内容
什么是面板(平行)数据
利用面板数据建立模型的理由
面板数据模型一般表达形式
固定效应模型
随机效应模型(误差成份模型)
案例分析
3
什么是面板数据
经典计量经济学模型使用的或者是时序序列数据(time series data),或者是截面数据(crosss section data)。
面板数据模型是将时间序列和截面数据联合使用建立的模型。
可以增大样本数量
可以增大变量的变异程度
可以分析不同观察对象之间的差异
可以分析不同时期之间的差异
可以分析跨时期的因果关系(动态模型)
概括而言,联合使用时间序列和截面混合数据(Pooled data)增加了信息含量,这不仅有利于改善模型估计结果,而且可以探讨单纯用时间序列数据或截面数据无法分析的问题。
面板数据有哪些来源
在现实生活中,有大量的公开统计数据属于时间序列和截面混合数据。
历年分行政区的统计数据
上市企业报表
国家统计局居民收支调查 (定期轮换)
农产品成本调查数据
农业部农村经济研究中心固定观察点调查资料
…
4
5
处理时间序列和截面混合数据的方法
处理时间序列和截面混合数据有以下两种做法:
混合数据模型:将针对不同时期、不同对象的观察结果(指标)看作是随机抽取的观察值。
处理方法最为简便,但由样本提取的信息不够充分。
面板数据模型(Panel data):将针对不同时期、不同对象的观察结果看作是与时期或截面相关联的现象。
处理方法较复杂,但能够更充分地利用样本信息。
混合数据模型可以被看作是处理面板数据的一种特例。
在应用工作中,可以将面板数据分为:
平衡的面板数据(样本量=N*T)
非平衡的面板数据(样本量= )
6
将时间序列和截面数据混合使用的主要理由
例1:供给行为模型
在生产函数分析中,人们长期关注的一个问题是如何分离规模经济和技术进步产生的效果。
就我国农村情况而言,这类研究有助于回答是否应鼓励扩大农户经营规模这一政策问题。
截面数据可以反映规模差异的影响,但无法考虑技术进步。
时间序列数据将两者的影响混合在一起而难以分离。
7
将时间序列和截面数据混合使用的主要理由
Greene的例子
成本函数为
由成本函数可以计算出技术进步率:
也可以计算出规模经济系数:
8
将时间序列和截面数据混合使用的主要理由
例2:需求行为模型
对需求行为分析造成困扰的一个难题是如何分离收入变化的影响和价格变化的影响。
两者的动态变化模式常常表现出高度相关,因而利用时间序列数据建立模型面临严重的多重共线。
利用Panel数据可以增大价格和收入的变异程度,降低其相关程度,从而改善模型参数的估计结果。
此外Panel数据样本量较大,因而允许引入更多的其他影响因素(例如人口学变量)。
Panel模型结果可以帮助识别观察对象间的差别及消费行为随时间的变化模式,这些信息有助于决策制定。
9
面板数据模型
在应用研究中,如果观察对象数量很大,那么建立反映每个观察对象行为的时序关系模型将是一项非常复杂和费时的工作。
由于这一因素,在应用研究中很少采用上述方法。
为了简化分析,研究人员常常假定:
斜率不随截面和时间变化
与每个观察对象相联系的特殊效应可以跨时期传递
与每个时期相联系的特殊效应适用于当期所有个体
模型的误差项满足特定的分布(涉及到估计技术选择)
均值和方差是否随时间和截面变化
是否存在序列相关
是否存在异方差
面板数据模型
考虑以下利用混合数据建立的模型(2N个待估计参数)
此表达式意味着为每个截面单独建立模型。
是否可行(样本容量)
是否必要(研究目的)
简化假定1:有共同的斜率(N+1个待估计参数)
上述情况属于截面固定效应模型(Fixed effect model) 。
简化假定2:有共同的常数项和斜率(2个待估计参数)
10
11
固定效应模型
对于面板数据,固定效应可以针对截面,也可以针对时期。
固定效应是一个无法观察的因素,反映除Xit以外所有其他因素产生的综合影响。
利用时间序列和截面混合数据建立模型时,如果忽略与不同时期或观察对象相联系的特殊效应,那么不仅会造成信息损失,而且会出现遗漏重要解释变量错误。
当固定效应与解释变量X相关时,OLS方法得出有偏的参数估计。
建立面板数据模型可以避免得到有偏的参数估计,并且可以对模型进行更为严谨的统计检验。
多余的固定效应/序列相关/Hausman检验
12
固定效应模型
考虑只涉及两个时期的情况,此时样本容量为2N。
假定总体模型为:
Yit = β0 + D2t + β1Xit1 +…+ βkXitk +(i + eit)
此处D2t是代表第二个时期的虚拟变量
方程中加了一个不随时间变化的误差项i
文档评论(0)