面板数据回归_13.1.1 面板数据的概念及优势.pdf

下载文档

110
0
约2.66千字
约 17页
2020-12-17 发布于广东
举报
版权申诉
保障服务

面板数据回归_13.1.1 面板数据的概念及优势.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

对外经济贸易大学计量经济学 I n t r o d u c t i o n t o E c o n o m e t r i c s 导论面板数据的概念及优势面板数据的概念及其优势面板数据包括多个个体（个人，州，公司…）的观察值, 其中每个个体有两期或者两期以上的观察值。例如: 01 1999和2000年，加州420个学区的面板数据，一共包含840个观察值。 02 中国31个省级行政区（不包括港澳台）的2015- 2018年的年度数据，每个省有4年的观察值。 03 1000个个体4个月的月度数据，一共有4000个观察值。面板数据的概念面板数据有横截面和时间两个维度，N个横截面个体、 T个观测时期，若N远大于T，称之为短面板，本章只讨论短面板。我们通常用双重下标来区分个体和时期，样本个体表示为面板数据的概念及其优势 01 i = 个体，i = 1,…,n ，其中n 为总的个体数目 02 t = 时期，t =1,…,T ，其中T 为总的时期长度 11 21 ⋯ 1 12 22 ⋯ 2 ⋮ ⋮ ⋮ ⋮ 1 2 ⋯ 面板数据的符号如果数据集包含了变量x 和y ，那么该数据可以表示为 (x , y ), i = 1,…,n, t = 1,…,T it it 01 面板数据又称为纵列数据(longitudinal data) 02 平衡面板（balanced panel）: 全部变量的所有个体和时期的数据都能观察到，没有数据缺失。 03 伪面板数据：独立混合横截面，每一期所包含的个体不一样。面板数据有何优势？面板数据可以控制一些因素： 01 随个体变化但不随时间变化 02 可能造成遗漏变量偏差（遗漏变量偏差） 03 不可观测面板数据有何优势？主要思想：如果模型中遗漏了一个不随时间变化的变量，那么该变量不可能是导致y 随时间变化的因素。面板数据实例：交通事故死亡人数和酒精税数据结构：美国的48个州，n = 48 1982– 1988，7年的数据, T= 7 平衡面板，总的观察值个数 = 7 ×48 = 336 面板数据实例：交通事故死亡人数和酒精税变量: 交通死亡率 (每州每年的每万人死亡人数) 啤酒税其他（法定驾驶年龄，酒驾的法律规定，等等） 1982年美国交通事故死亡数据: 啤酒税越高，交通事故死亡人数越多？为什么啤酒税越高的州交通事故死亡人数越多？其他影响交通事故死亡率的因素： 01 汽车质量（年份） 02 道路状况 03 关于酒驾的“文化” 04 路上的汽车密度可能存在遗漏变量偏差例1:交通密度。 1 .高的交通密度意味着更多的交通死亡 2 . 交通密度高的州通常酒精税也高产生遗漏变量偏差的两个条件都满足了。具体地，“高税收”可能是“高的交通密度” 的反映。OLS估计量的系数可能偏高高税收导致高死亡率。可能存在遗漏变量偏差例1:交通密度。 1 .高的交通密度意味着更多的交通死亡 2 . 交通密度高的州通常酒精税也高如果漏掉的变量在州内不随时间变化，则面板数据可