- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章数据管理要点
第二章 数据管理 主要内容 变量和变量的取值 创建一个新的数据集 导入已创建的数据集 Stata中的表达式 Stata中的常用函数 使用in、if和by语句定义数据子集 主要内容 变量的相关操作 数值和字符串的转换 生成分类变量和虚拟变量 数据的整理 2.1.1 数据结构和命名规则 表2-1 数据结构 变量名称 变量1 变量2 变量3 变量4 …… 观测案例1 变量取值…… 观测案例2 观测案例3 观测案例4 Stata的命名原则: 变量名可达32个字符; 字符组成部分为A~Z、a~z、0~9与下划线“_”,这些字符之外的其他符号不可以出现在变量名中; 变量名不能以数字开头,所以5shanghai是不合法的,而shanghai5是非法的; 变量名区分大小写,所以shanghai和Shanghai以及ShangHai是三个不同的变量名。 2.1.2 变量的取值类型 字符型数据:存储格式是str#,其中str表示Stata使用字符型变量的格式,而#表示Stata该变量的存储最多可容纳的字符数。 数值型数据 缺失数据:Stata有27个数值型代码:. 、.a、.b、.c、.d、…….z。 2.1.3 变量的显示 数值变量的显示格式 字符变量的显示格式:字符变量的显示格式只有一种。其表达式为%#s。其中,%是一个提示符;#表示显示的字符数,即宽度;s表示字符变量的显示格式。 使用format命令规范变量的显示格式为变量规定显示格式: format varlist %fmt 或者 format %fmt varlist 显示变量目前所采用的格式:format [varlist] 2.1.3 变量的显示 【例2.1】有如表2-4所示的一个数据集format.dta,每个变量在Stata中的显示类型如下:state为%14s表名美国各州的名称,因而是字符型变量;pop为%11.0g表明该州的总人口,是数值型变量;而medage是各州人口的年龄中位数,显示格式是%9.0g,以浮点型方式存储。我们希望将各个变量的显示方式做如下转换: stata %14s——%-14s(即由右对齐改为左对齐); pop %11.0g——%12.0gc(增加三位一个的数字分界符); medage %9.0g——%8.1f(要求显示一位小数)。 2.1.3 变量的显示 表2.4 数据集format.dta 2.1.4 变量的标签 1. 添加数据集的标签使用: label data [label] 2. 添加变量的标签使用: label variable varname [label] label为变量数值添加标签的语法包括两部分, 首先是定义数值标签(value label): label define lblname # label [# label ...] 然后将定义好的数值标签(value label)添加到变量上: label values varlist [lblname|.] 2.2 创建一个新的数据集2.2.1关于数据集操作的基本命令 1. browse和edit命令 edit [varlist] [if] [in] browse [varlist] [if] [in] 2.rename命令 rename old_varname new_varname 3. save命令 save [filename] [, save_options] nolabel 不保存设定的标签。 replace 允许新的文件覆盖原有文件,这是一个常用的选项。 all 主要用于编程,指定将e(sample)与数据一起保存。 2.2.1关于数据集操作的基本命令 4. describe命令 describe [varlist] [, memory_options] 5. list命令 list [varlist] [if] [in] [, options] separator(#) 每隔#行画一条分割线,默认情况是separator(5), 即每隔5行画一条分割线。 sepby(varlist) 每当varlist数值发生变化时就画一条分割线。 nolabel 显示变量的赋值而不是标签。 6.codebook命令 codebook [varlist] [if] [in] [, options] 举例应用:创建新的数据集auto.dta 【例2.2】本例利用2.1.1中所介绍的命令创建表2-9所示的名为auto.dta的数据集。
您可能关注的文档
最近下载
- 美式箱变技术规范.pdf VIP
- 标准图集-15SS510 绿地灌溉与体育场地给水排水设施.pdf VIP
- 物业春节节前安全培训.pptx VIP
- 2025中国软件行业基准数据报告.pdf
- 7-1《风景谈》课件(共36张PPT) 统编版高中.pptx VIP
- T_CTESGS 02-2022 长江流域和澜沧江以西(含澜沧江)区域河湖管理范围内建设项目工程建设方案洪水影响审查技术标准.pdf
- 食品药品安全培训.pptx
- 《英语导游听说教程》教学课件—9 Touring Shaanxi.ppt VIP
- 贵州湿地保护发展规划+说明书.pdf VIP
- 2025年幼儿园工作总结及2026年工作打算(2篇).docx
原创力文档


文档评论(0)