Stata面板数据统计分析.docVIP

下载本文档

20
0
约3.67千字
约 4页
2016-07-05 发布于重庆
举报
版权申诉

Stata面板数据统计分析.doc

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Stata面板数据统计分析

面板数据的统计分析）在写论文时经常碰见一些即是时间序列又是截面的数据，比如分析1999-2010的公司盈余管理影响因素，而影响盈余管理的因素有6个，那么会形成如下图的数据 ? 公司1 公司2 公司100 ? 因素1 因素6 盈余管理程度因素1 … 因素6 盈余管理程度因素1 因素6 盈余管理程度 1999 ? ? ? ? ? ? ? ? ? ? ? ? 2000 ? ? ? ? ? ? ? ? ? ? ? ? …… ? ? ? ? ? ? ? ? ? ? ? ? 2010 ? ? ? ? ? ? ? ? ? ? ? ? ???? 如上图所示的数据即为面板数据。显然面板数据是三维的，而时间序列数据和截面数据都是二维的，把面板数据当成时间序列数据或者截面数据来处理都是不合适的。 ???? 处理面板数据的软件较多，一般使用Eviews6.0、Stata等。个人推荐使用Stata，因为Stata比较适合处理面板数据，且个性化强。以下以Stata11.0为例来讲解怎么样处理面板数据。 ???? 由于面板数据的存储结构与我们通常使用的存储结构不太一样，所在统计分析前，最好在excel中整理一下数据，形成如下图所示的数据年份公司名称因素1 因素2 …… 因素6 盈余管理程度 1999 公司1 ? ? ? ? ? 2000 公司1 ? ? ? ? ? …… 公司1 ? ? ? ? ? 2010 公司1 ? ? ? ? ? 1999 公司2 ? ? ? ? ? 2000 公司2 ? ? ? ? ? …… 公司2 ? ? ? ? ? 2010 公司2 ? ? ? ? ? ?变量定义及输入数据 ??? 启动Stata11.0，Stata界面有4个组成部分，Review（在左上角）、Variables（左下角）、输出窗口（在右上角）、Command（右下角）。首先定义变量，可以输入命令，也可以通过点击Data----Create new Variable or change variable。?? ??? 特别注意，这里要定义的变量除了因素1、因素2、……因素6、盈余管理影响程度等，还要定义年份和公司名称两个变量，这两个变量的数据类型（Type）最好设置为int（整型），公司名称不要使用中文名称或者字母等，用数字代替。定义好变量之后可以输入数据了。数据可以直接导入（File-Import），也可以手工录入或者复制粘贴（Data-Data Edit(Browse)），手工录入数据和在excel中的操作一样。 ?? 以上面说的为例，定义变量 year、 company、 factor1、 factor2、 factor3、 factor4、 factor5、 factor6、 DA。 ?? 变量company 和year分别为截面变量和时间变量。显然，通过这两个变量我们可以非常清楚地确定panel data 的数据存储格式。因此，在使用STATA 估计模型之前，我们必须告诉它截面变量和时间变量分别是什么，所用的命令为tsset，命令为：tsset ?company ?year ??? 输出窗口将输出相应结果。由于面板数据本身兼具截面数据和时间序列二者的特性，所以对时间序列进行操作的运算同样可以应用到面板数据身上。这一点在处理某些数据时显得非常方便。如，对于上述数据，我们想产生一个新的变量Lag _factor1 ，也就是factor1 的一阶滞后，那么我们可以采用如下命令：gen Lag_factor1=L.factor1 差分变量： Gen fiscal(D)=D.fiscal 统计描述：在正式进行模型的估计之前，我们必须对样本的基本分布特性有一个总体的了解。对于面板数据而言，我们至少要知道我们的数据中有多少个截面(个体) ，每个截面上有多少个观察期间，整个数据结构是平行的还是非平行的。进一步地，我们还要知道主要变量的样本均值、标准差、最大值、最小值等情况。这些都可以通过以下三个命令来完成： xtdes 命令用于初步了解数据的大体分布状况，我们可以知道数据中含有多少个截面，最大和最小的时间跨度是多少。在某些要求使用平行面板数据的情况下，我们可以采用该命令来诊断处理后的数据是否为平行数据。Xtsum用来查询对组内、组间、整体计算各个变量的基本统计量（如均值、方差等）。为了方便，以下的举例都只用factor1，factor2两个自变量。 ?xtdes DA factor1 facto2xtsum DA factor1 facto2 ?模型回归。 ?? 常用的处理面板数据的模型有混合OLS模型、固定效应模型、随机效应模型。各个模型的区别请上网查查。下面说说各个模型的命令： ??混合OLS模型输入命令：regres