计量经济学教案第八章数据整理与描述.docVIP

计量经济学教案第八章数据整理与描述.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计量经济学教案第八章数据整理与描述

第八章 数据整理与描述 数据文件是一个矩形的矩阵,这个矩阵的每一行都代表或对应着一个“观测单位”(如张三、李四、王五),矩阵的每一列都代表或对应着一个“变量”(比如年龄,身高、体重,月工资收入等等)。因此,数据文件矩阵中的每一个元素(case)都代表或对应着某一个“观测单位”中的某一个“变量”的变量值或观察值。数据可以自己创建生成,也可以利用他人已经整理好的数据。 一、生成一个完整的数据集 要掌握的命令:为了创建一个完整的文件,要掌握下面的命令。 命令 命令解释 用法示例 dir 列示当前路径文件夹中的所有文件 dir cd 将cd后面的路径设定为当前路径 cd d:/mydata describ 显示整个数据集的信息 des rename 将现有变量名改为新的变量名 rename gender sex label 给数据/变量/变量值加注标签说明 label data 标签数据 label data “2004级成绩表” label var 标签变量 label var name “姓名” label value label define 标签变量值 label values gender genderlb label define genderlb 1 男 0 女 note 为数据加注额外说明 note: 9月10日为数据加注说明 list 列示内存中的数据 list id name save 保存数据 save mydata, replace 以上命令可以通过help command查看到具体的命令格式. (一)创建一个数据文件 例:创建一个文件(文件名为mydata.dta),标签该数据(用label命令)使得任何一个使用该数据的人都能明白该数据(包括整个数据/其中的变量及变量值)的含义。 原始数据的内容如下,请将下表复制粘贴到EXEL表格中然后保存为origin.xls 1 John 1 1 40 68 2 Chris 1 2 80 52 3 Jack 0 2 90 76 4 Huang 0 2 43 90 5 Tom 0 3 70 96 6 Han 1 1 53 85 7 Phillip 0 2 85 36 8 Jin 1 2 95 65 其中第一列为学号id,第二列为姓名name,第三列为性别gender(1表示男性,0表示女性),第四列为民族minority(1表示汉族,2表示少数民族,3表示不知道);第五列为经济学成绩economy,第六列为数学成绩math。 案例的参考操作 下面程序中的所有命令中加黑的为固定用法,不能灵活选择;而斜体表示文件名和变量名,可以自己根据自己的文件名和变量名情况灵活选择或改动。 (一)变量重命令 采用直接复制粘贴法,将原始数据粘入stata,然后退出数据编辑器,先将该数据保存起来,文件名为origin.dta save origin, replace 新粘入的变量自动命令为var1, var2,...var6,为使变量容易理解和记忆,要将变量重新命名,命令为name。在此之前,可以先用一个describ命令看看数据情况。 des //查看数据集的整体情况,注意变量名为var1-var6 renpfix var v //将所有var开头的变量名改为以v开头 rename v1 id //将第一个变量重新命令为id ren v2 name ren v3 gender ren v4 minority ren v5 economy ren v6 math des //再次查看数据集的整体情况,注意变量名已改变 (三)标签文件 为避免时间太长,忘记变量的含义,我们可以用label命令来标记。该命令可以用来标记数据文件,如将文件取名为“2007年秋5632班学习成绩单” label data “2007年秋5632班学习成绩单” 在文件处理过程中加注说明,命令为notes note: 2007年9月6日由任我行创建该数据 下一次打开数据,要查看创建和数据处理的说明时,直接键入 note 标签变量:label var 也可以用label命令来标记变量,如将id标记为“学号” label var id “学号” label var name “姓名” label var gender “性别” label var minority “民族” 标签变量值:label define和label values 还可以标记变量的取值。注意要按以下两步来操作: label define genderlb 1 男 0 女 l //注意

文档评论(0)

wumanduo11 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档