- 319
- 0
- 约6.86千字
- 约 29页
- 2018-08-22 发布于江苏
- 举报
stata中变量的生成与处理3
第四章变量的生成与处理 导论 Stata 对数据的处理是以变量为前提的 若没有需要分析的变量,则Stata将一无用处 熟悉变量的内容和分布、生成新变量、改变旧变量等是处理数据的第一步 4.1. 新变量的生成、规则及注意事项 Stata的变量类型 Stata软件生成三类变量:numeric(数值型)变量,string(字符型)变量(相当于定性变量)和date(日期)变量。虽然日期变量以数值型变量的技术记录、存储,但二者的用途却不同 数值型变量包括定距和定比变量。可以是整数、小数、负数和正数。数值型变量可以有多种存储方式( Storage Types) 用str类型保存的定性等分类变量也可区分为多种形式,从str1-str244 Stata的日期变量 日期(date)变量是数值型变量的一个特例。它们通常以字符的形式输入(如: 01JAN1992 or 01/01/92),但必须以数值型数据存储才能有用 Stata有几个命令可以工作于日期和时间依赖(time-dependent)数据 Stata将所有的日期保存为从1960年1月1日以来的天数或月份、季节等。此前的日期是负值,此后的是正值。SAS使用同样的日期方式,但其起始时间是1582年的10月14日。Excel使用1900年1月1日为默认起始日。如果读入Excel数据,则以字符型变量输入日期,并重新格式日期 生成变量的路径 Data — Create or change variables 生成变量的窗口 Data — Create or change variables — Create new variable 基本命令 Stata有四个基本的生成和修改变量的命令:gen、egen、replace和recode . gen和egen分别是generate和extended generate的缩写,它们用于生成新变量 . replace和recode用来改变现存变量的属性或数值 . replace需要与gen一起使用;二者的区别在于,gen用于生成新变量,replace用于重新定义已经存在的变量 . recode也可以与gen一起使用 基本语法 . gen [变量名] = [表达式1] ① ② ③ . replace [变量名] = [表达式2] if [条件] ① ② ③ ④ ①:生成新变量或替代现存变量取值的基本命令 ②:新变量或其取值将被替换的变量的名称 ③:在gen命令的取值不同于在replace命令的取值 ④:替换原有变量的取值必须满足if指定的条件 *yr of schooling recoded(这是一个注释;*代表注释) gen edu=0 replace edu=1 if yrsch==11 replace edu=2 if yrsch==12 replace edu=3 if yrsch==13 replace edu=4 if yrsch==14 replace edu=5 if yrsch==15 replace edu=6 if yrsch==16 replace edu=7 if yrsch==21 replace edu=8 if yrsch==22 replace edu=9 if yrsch==23 replace edu=10 if yrsch==24 | yrsch==27 replace edu=11 if yrsch==25 | yrsch==28 replace edu=12 if yrsch==26 | yrsch==29 replace edu=13 if yrsch==31 replace edu=14 if yrsch==32 replace edu=15 if yrsch==33 replace edu=16 if yrsch==34 replace edu=17 if yrsch==35 replace edu=18 if yrsch==36 replace edu=. if yrsch==. | yrsch==-9 tab1 yrsch edu *查看变量的生成是否成功 变量生成的规则(I) 生成新变量、重新定义旧变量时需遵循的一些基本规则: 变量的名称可长达32个字符,必须以字母、汉字或字符(@,_,#,$等)开头(不能使用空白字符或!、?等特殊字符)。变量最后一个字符不能是句号 变量的名称必须唯一,不能有两个相同的变量名 Stata区分大小写,对大写、小写敏感:Variable 不能写成 variable,反之亦然 使用描述性的变量名字:“变量a”这个名称没有任何意义。
原创力文档

文档评论(0)