计量经济学 课件 第2章 数据管理.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 数据管理学习目标:1. 能够利用Stata软件进行数据导入、变量命名及添加变量标签、数据类型转换、数据拆分以及数据合并等数据管理工作;2. 能够进行变量的错误值、缺失值和极端值的检查与处理;3. 能够采用图形和表格等形式对单个变量和多个变量进行统计描述。第一节 数据的整理一、建立数据集建立数据集,可以通过键盘输入的方式进行,也可以将收集到的数据,导入到Stata软件。打开Stata软件后,自左向右依此是历史窗口(History)、命令窗口(Command)、变量窗口(variables)和属性窗口(properties)。历史窗口显示使用过的命令;命令窗口是输入操作的命令,操作的结果将显示在命令窗口的上方;变量窗口位于右侧,显示数据集中的各个变量及变量的标签;属性窗口,包括变量属性和数据属性。点击变量窗口中的变量,在属性窗口可以显示这一变量的名称、标签、类型和格式等属性;数据的属性主要显示的是来源数据集属性。(一)键盘输入数据 点击工具栏图标中的 ,或者在第一行菜单中找到“数据——数据编辑器——数据编辑器(编辑)”,即显示出可进行编辑的数据表。然后在数据表中输入数据,通常按照纵向输入数据,输入数据后,这一列默认的变量名是var1,需要在右侧属性窗口中变量名称var1处填写变量名称。也可以使用命令rename修改变量名称,命令为.rename old_varname new_varname 若是复制粘贴excel等表格中的数据,会出现询问“您要将第一行作为变量名还是数据”,若从Excel表中复制过来的数据第一行是变量名,则点击“变量名”,否则点击“数据”。(二)导入数据 1.对于dta格式的数据 (1)通用的方法是使用命令use,命令为: .use filename, clear 其中,filename是指导入的文件名,包括文件路径和文件名,如果数据文件路径中包含空格,则filename需要添加双引号,clear表示在导入新数据之前清空Stata内存中的数据。 但使用use命令时要先设定一下程序运行所在的路径,命令为: .cd filepath 例如,现在要做一篇论文A,可以在电脑桌面定义一个文件夹Afilepath,在后续所有的实证分析开始之前,首先设定一下Afilepath的文件夹所在的路径,然后使用use命令调用数据: .cd C:\Users\Desktop\Afilepath .use filename,clear 提前设定程序运行的路径之后,后续的一切输出结果将自动保存到该路径之下。 (2)也可以直接点击菜单中“文件-打开”即可导入。 (3)也可以直接把dta格式的数据文件拖到命名窗口导入。 2.对于xlsx、csv、sav、dbf和文本等多种格式的数据 通常使用import命令,如D盘users文件下xlsx格式文件data1,导入的命令为: .import excel “D:\users\data1.xlsx”,clear(三)数据标签 在输入或导入数据后,需要为变量添加标签,以便于后续研究时查看与使用。 1.为数据集添加标签 .label data label 其中,label data表示为数据集添加标签,label表示标签的内容,可以使用中文,放在引号内。 2.为变量添加标签 .label variable varname label 其中,label variable表示为变量添加标签,varname为需要添加标签的变量名; “label”为标签的内容。 如对于虚拟变量gender,1表示男性,0表示女性,可添加标签,命令为.label variable gender 性别:1表示男性;0表示女性 3.为变量取值添加标签 有时也需要对变量的取值添加标签,如对于表示性别的虚拟变量添加取值标签。 (1)采用label define命令 .label define labelname #label1 # label2 # label3 其中labelname是变量取值标签的名称,为了便于记忆,name处可以与变量名称相同。#表示该变量的具体不同取值,“label1”是第一个取值的标签,“label2”是第二个取值的标签,标签使用中文,以此类推。 (2)采用label values命令,将变量取值标签赋予该变量,才能完成为变量取值添加标签工作,命令为 .label values varname labelname 引例2-1 个体受教育程度的取值标签 从中山大学“中国劳动力动态调查数据”(CLDS)中获取个体受教育程度信息,受教育程度变量education,取值为0,表示未上过学;1表示小学;2表示初中;3表示普通高中;4表示职业高中;5表示中专; 6表示技校;7表示大专;8表示

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档