- 1、本文档共80页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Stata实验指导、统计分析和应用chap13
主阀荚没膀尤构侦仰育书席横肌堵曳慌艳沥禹逼柑建癸墨棋衙瞬丹熊刮摧Stata实验指导、统计分析和应用chap13Stata实验指导、统计分析和应用chap13;主要内容;实验13-1: 面板数据的基本操作;实验内容及数据来源
本书附带光盘data文件夹下的“wage.dta”工作文件给出了对4711名妇女的调查数据,调查的时间跨度为1968年到1988年。该文件的主要变量包括:idcode=编号,year=调查时间,hours=平均每周的工作时间,msp=是否已婚(1代表已婚且随配偶居住,0代表其他情况),ln_wage=小时工资的自然对数,grade=受教育年数,age=年龄,ttl_exp=总工作年数,tenure=现有岗位的任职时间,race=种族(1表示白人,2表示黑人,3表示其他人种),not_smsa=是否居住在SMSA区(1表示不住在SMSA区-Standard Metropolitan Statistical Area),south=是否生活在南方(1表示住在南方),union=是否为工会成员(1表示是工会成员)。
利用这些数据,我们来讲解面板数据的定义、描述统计量的获得、数据结构的描述、分布频率和转移概率的获得以及各个截面时间趋势图的绘制等操作。
;实验操作指导
1 面板数据的设定
与时间序列分析类似,在对面板数据进行分析之前,我们要先对面板数据进行设定。只有定义过面板数据之后,才能使用相关的面板数据命令。设定面板数据的命令有三种:
① xtset panelvar
② xtset panelvar timevar [, tsoptions]
③ tsset panelvar timevar [, tsoptions]
其中,xtset是“定义面板数据”的基本命令,panelvar代表截面变量的名称,timevar代表时间变量的名称,tsoptions代表其他选项。tsset作为定义时间序列的基本命令,也可以用来定义面板数据,如③所示。此外,可用的tsoptions选项与十二章中时间序列变量的设定相同,详见表12.2和表12.3。
;在第一种格式当中,我们只设定了截面变量,这样,每一截面中,各个观测值的顺序是无关紧要的。例如,我们有对多个家庭的调查数据,每个家庭是一个截面,而家庭的各个成员是截面内的观测值,这种情况下,我们就不必设定时间变量。
第二种和第三种定义面板数据的格式是等价的。这两种情况下,每一截面中的观测值会被按照时间变量进行排序。这时,我们还可以使用stata的各种时间序列算子,像滞后算子“L.”、领先算子“F.”等。
需要注意的是,截面变量和时间变量都必须为数值型,还要是整数。如果某个变量是字符串型,我们可以通过如下命令将其转换为数值型:
encode varname, gen(newvar)
其中,命令encode表示生成带标签的数值变量,varname是原字符串变量的名称,生成的新变量命名为newvar,其类型为数值型,且每个数值以原变量varname的值为标签。
对于数据文件“wage.dta”,我们定义idcode为截面变量,year为时间变量。输入命令:
xtset idcode year
;2 获得面板数据的描述统计量
获得面板数据描述统计量的基本命令为:
xtsum [varlist] [if]
其中,xtsum是“计算面板数据描述统计量”的基本命令,varlist代表变量的名称,if代表条件语句。xtsum命令实际是summarize命令的扩展,该命令还会给出组内和组间的描述统计量。
我们要获得“wage.dta”中变量hours的描述统计量,可输入命令:
xtsum hours
;3 显示面板数据的结构
为了直观地了解面板数据的分布,我们可以对其结构进行描述。命令为:
xtdescribe [if] [in] [, options]
其中,xtdescribe是“显示面板数据结构”的基本命令,if代表条件语句,in代表范围语句,options为其他选项。可用的选项包括patterns(#)和width(#)。patterns(#)用于指定显示结构的种数,默认为patterns(9);而width(#)用于指定每一行的显示宽度,默认为width(100)。
对于“wage.dta”的数据,我们要知道其数据分布情况,可输入命令:
xtdescribe
;4 显示面板数据的分布频率
获得面板数据分布频率的基本命令为:
xttab varname [if]
其中,xttab是“计算面板数据分布频率”的基本命令,varname代表变量的名称,if代表条件语句。xttab命令实际是tabulate命令的扩展,该命令还会给出组内和组间的分布频率。
我们要获得“wage.dta”中变量m
文档评论(0)