面板数据回归_13.1.1 面板数据的概念及优势.pdf

面板数据回归_13.1.1 面板数据的概念及优势.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对外经济贸易大学 计量经济学 I n t r o d u c t i o n t o E c o n o m e t r i c s 导论 面板数据的概念及优势 面板数据的概念及其优势 面板数据包括多个个体(个人,州,公司…)的观 察值, 其中每个个体有两期或者两期以上的观察值。 例如: 01 1999和2000年,加州420个学区的面板数据, 一共包含840个观察值。 02 中国31个省级行政区(不包括港澳台)的2015- 2018年的年度数据,每个省有4年的观察值。 03 1000个个体4个月的月度数据,一共有4000个观察值。 面板数据的概念 面板数据有横截面和时间两个维度,N个横截面 个体、 T个观测时期,若N远大于T,称之为短面 板,本章只讨论短面板。 我们通常用双重下标来区分个体和时期, 样本个体表示为 面板数据的概念及其优势 01 i = 个体,i = 1,…,n ,其中n 为总的个体数目 02 t = 时期,t =1,…,T ,其中T 为总的时期长度 11 21 ⋯ 1 12 22 ⋯ 2 ⋮ ⋮ ⋮ ⋮ 1 2 ⋯ 面板数据的符号 如果数据集包含了变量x 和y ,那么该数据可以表示为 (x , y ), i = 1,…,n, t = 1,…,T it it 01 面板数据又称为纵列数据(longitudinal data) 02 平衡面板(balanced panel): 全部变量的所有个 体和时期的数据都能观察到,没有数据缺失。 03 伪面板数据:独立混合横截面,每一期所包 含的个体不一样。 面板数据有何优势? 面板数据可以控制一些因素: 01 随个体变化但不随时间变化 02 可能造成遗漏变量偏差(遗漏变量偏差) 03 不可观测 面板数据有何优势? 主要思想: 如果模型中遗漏了一个不随时间变化的变量, 那么该变量不可能是导致y 随时间变化的因素。 面板数据实例: 交通事故死亡人数和酒精税 数据结构: 美国的48个州,n = 48 1982– 1988,7年的数据, T= 7 平衡面板,总的观察值个数 = 7 ×48 = 336 面板数据实例: 交通事故死亡人数和酒精税 变量: 交通死亡率 (每州每年的每万人死亡人数) 啤酒税 其他(法定驾驶年龄,酒驾的法律规定,等等) 1982年美国交通事故死亡数据: 啤酒税越高,交通事故死亡人数越多? 为什么啤酒税越高的州交通事故 死亡人数越多? 其他影响交通事故死亡率的因素: 01 汽车质量(年份) 02 道路状况 03 关于酒驾的“文化” 04 路上的汽车密度 可能存在遗漏变量偏差 例1:交通密度。 1 .高的交通密度意味着更多的交通死亡 2 . 交通密度高的州通常酒精税也高 产生遗漏变量偏差的两个条件都满足了。 具体地,“高税收”可能是“高的交通密度” 的反映。OLS估计量的系数可能偏高高 税收导致高死亡率。 可能存在遗漏变量偏差 例1:交通密度。 1 .高的交通密度意味着更多的交通死亡 2 . 交通密度高的州通常酒精税也高 如果漏掉的变量在州内不随时间变化, 则面板数据可

文档评论(0)

恬淡虚无 + 关注
实名认证
内容提供者

学高为师,身正为范.师者,传道授业解惑也。做一个有理想,有道德,有思想,有文化,有信念的人。 学无止境:活到老,学到老!有缘学习更多关注桃报:奉献教育,点店铺。

1亿VIP精品文档

相关文档