- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三讲 数据与变量操作 导论 Stata 对数据的处理是以变量为前提的 若没有需要分析的变量,则Stata将一无用处 熟悉变量的内容和分布、生成新变量、改变旧变量等是处理数据的第一步 4.1 数据类型 1.时间序列数据 2.面板数据 2.面板数据类型 时间维度(T)+截面维度(N) 如我们在分析中国各省份的经济增长时,共有31个截面,每个截面都取1999-2013共15年的数据,共有465个观察值,这是一个典型的平行面板数据 上市公司财务数据,研究一段时期内(1998-2008)上市公司股利的发放数额与股票账面价值之间的关系,共有20 ×11=220个观测值 强调经济理论基础、强调微观行为基础 表1 1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格) 地区人均消费 1996 1997 1998 1999 2000 2001 2002 CP-AH(安徽) 3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364 CP-BJ(北京) 5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12 CP-FJ(福建) 4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005 CP-HB(河北) 3197.339 3868.319 3896.778 4104.281 4361.555 4457.463 5120.485 CP-HLJ(黑龙江) 2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535 CP-JL(吉林) 2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874 CP-JS(江苏) 3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331 CP-JX(江西) 2714.124 3136.873 3234.465 3531.775 3612.722 3914.080 4544.775 CP-LN(辽宁) 3237.275 3608.060 3918.167 4046.582 4360.420 4654.420 5402.063 CP-NMG(内蒙古) 2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180 CP-SD(山东) 3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770 CP-SH(上海) 6193.333 6634.183 6866.410 8125.803 8651.893 9336.100 10411.94 CP-SX(山西) 2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 4787.561 CP-TJ(天津) 4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843 CP-ZJ(浙江) 5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210 表2 上市公司的投资与股票账面价值:N=20,T=4 面板数据模型和stata软件应用 面板数据模型有以下几个优点: 第一,Panel Data 模型可以通过设置虚拟变量对个别差异(非观测效应)进行控制; 第二,Panel Data 模型通过对不同横截面单元不同时间观察值的结合,增加了自由度,减少了解释变量之间的共线性,从而改进了估计结果的有效性; 第三,观测值的增加,可以增加估计量的抽样精度; 第四,Panel Data模型是对同一截面单元集的重复观察, 能更好地研究经济行为变化的动态性。 举例 交通死亡率与酒后驾车人数(一段时间内江苏省各市) 其他的非观测(潜在)因素(南京与苏州) 汽车本身状况 道路质量 当地的饮酒文化 单位道路的车辆密度 非观测效应导致估计结果不准确,面板数据可以控制和估计非观测效应 4.2 新变量的生成、规则及注意事项 Stata的变量类型 Stata软
文档评论(0)