stata中变量的生成与处理.ppt

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 变量的生成与处理 导论 Stata 对数据的处理是以变量为前提的 若没有需要分析的变量,则Stata将一无用处 熟悉变量的内容和分布、生成新变量、改变旧变量等是处理数据的第一步 4.1. 新变量的生成、规则及注意事项 Stata的变量类型 Stata软件生成三类变量:numeric(数值型)变量,string(字符型)变量(相当于定性变量)和date(日期)变量。虽然日期变量以数值型变量的技术记录、存储,但二者的用途却不同 数值型变量包括定距和定比变量。可以是整数、小数、负数和正数。数值型变量可以有多种存储方式( Storage Types) 用str类型保存的定性等分类变量也可区分为多种形式,从str1-str244 Stata的日期变量 日期(date)变量是数值型变量的一个特例。它们通常以字符的形式输入(如: 01JAN1992 or 01/01/92),但必须以数值型数据存储才能有用 Stata有几个命令可以工作于日期和时间依赖(time-dependent)数据 Stata将所有的日期保存为从1960年1月1日以来的天数或月份、季节等。此前的日期是负值,此后的是正值。SAS使用同样的日期方式,但其起始时间是1582年的10月14日。Excel使用1900年1月1日为默认起始日。如果读入Excel数据,则以字符型变量输入日期,并重新格式日期 生成变量的路径 Data — Create or change variables 生成变量的窗口 Data — Create or change variables — Create new variable 基本命令 Stata有四个基本的生成和修改变量的命令:gen、egen、replace和recode . gen和egen分别是generate和extended generate的缩写,它们用于生成新变量 . replace和recode用来改变现存变量的属性或数值 . replace需要与gen一起使用;二者的区别在于,gen用于生成新变量,replace用于重新定义已经存在的变量 . recode也可以与gen一起使用 基本语法 . gen [变量名] = [表达式1] ① ② ③ . replace [变量名] = [表达式2] if [条件] ① ② ③ ④ ①:生成新变量或替代现存变量取值的基本命令 ②:新变量或其取值将被替换的变量的名称 ③:在gen命令的取值不同于在replace命令的取值 ④:替换原有变量的取值必须满足if指定的条件 *yr of schooling recoded(这是一个注释;*代表注释) gen edu=0 replace edu=1 if yrsch==11 replace edu=2 if yrsch==12 replace edu=3 if yrsch==13 replace edu=4 if yrsch==14 replace edu=5 if yrsch==15 replace edu=6 if yrsch==16 replace edu=7 if yrsch==21 replace edu=8 if yrsch==22 replace edu=9 if yrsch==23 replace edu=10 if yrsch==24 | yrsch==27 replace edu=11 if yrsch==25 | yrsch==28 replace edu=12 if yrsch==26 | yrsch==29 replace edu=13 if yrsch==31 replace edu=14 if yrsch==32 replace edu=15 if yrsch==33 replace edu=16 if yrsch==34 replace edu=17 if yrsch==35 replace edu=18 if yrsch==36 replace edu=. if yrsch==. | yrsch==-9 tab1 yrsch edu *查看变量的生成是否成功 变量生成的规则(I) 生成新变量、重新定义旧变量时需遵循的一些基本规则: 变量的名称可长达32个字符,必须以字母、汉字或字符(@,_,#,$等)开头(不能使用空白字符或!、?等特殊字符)。变量最后一个字符不能是句号 变量的名称必须唯一,不能有两个相同的变量名 Stata区分大小写,对大写、小写敏感:Variable 不能写成 variable,反之亦然 使用描述性的变量名字:“变量a”这个名称没有任何意义。

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档