SAS应用基础3-1 观测的条件删除.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS应用基础3-1 观测的条件删除

观测的条件删除 在统计分析中,为了提高效率等原因,可将数据集中暂时无关的观测用delete语句删除。(注意备份原始数据) delete语句用法: delete; 功能:可使系统停止处理当前观测值,且该观测值不会写进正在建立的数据集,使系统返回到DATA步开始处进行下一次执行。 例: data tmp; set sashelp.class; if sex=F height60 then delete; run; 数据步中选择变量 增加或修改变量值: INPUT 变量表; 变量名= 表达式; 保留或剔除变量: 在DATA 语句中用选项DROP= 和 KEEP= 在SET 语句中用选项DROP= 和 KEEP= 在DATA步中加入DROP语句和 KEEP语句 DROP/KEEP语句用法: drop 变量表; keep 变量表; 数据的批量修改、更新 UPDATE语句可完成用一个数据集的观测对另一个数据集进行批量修改。 其语法格式为: UPDATE 主数据集 (IN=变量名) 修正数据集 (IN=变量名) (END=变量名); 注意:要正确进行批量修正,UPDATE通常总是与BY语句配合使用,因而预先应将两数据集排序。 更新数据示例 data fix; /*建立修正数据集fix */ input name$ score@@; cards; He 46 Li 77 Wang 99 Xu 66 proc sort data=fix; /*对数据集fix按name变量排序*/ by name; proc sort data=bscore; by name; data fixed; /*建立修正结果数据集fixed */ update bscore fix;/*fix数据集去修正数据集bscore中的内容*/ by name; /*根据相同的name值进行更正*/ proc print; run; 数据表转置 利用TRANSPOSE过程可将SAS数据集转置,使新数据集中的变量对应原数据集的观察,而新数据集的观察对应原数据集的变量。 该过程通常的使用格式为: PROC TRANSPOSE 选项; [VAR 变量表;] [ID 变量;] [IDLABEL 变量;] [COPY 变量表;] [BY 变量表;] [RUN;] 转置过程的选项 PROC TRANSPOSE语句指明该过程将完成数据集的转置任务,其主要选项有: DATA=数据集 指定要作转置的数据集,如该项缺省,默认为最新建立的数据集; PERFIX=前缀名 指定一个前缀,与其后紧跟的连续自然数构成新数据集中的变量名; OUT=数据集名 指定转置后生成新数据集的名称,如缺省,系统将自动命名为DATAn形式。 转置过程的主要配合语句 VAR语句 列出要被转置的变量,如缺省,则原数据集中未在其它语句中出现的所有数值变量均被转置,字符型变量必须在VAR语句中列出才能被转置;未被转置的变量一般不能进入新数据集,除非它们在COPY或BY语句中已列出。 ID语句 指定某变量的值作为新数据集中的变量名;若缺省,系统将以COL1、COL2、…等作为新数据集的变量名。 COPY语句 将原数据集中的变量直接拷贝到输出数据集中。 BY语句 对原数据集进行分组转置,分组变量包括在输出数据集中。注意,用该语句前,原数据集应已排序。 转置数据集示例 data score; input name$ chinese english math@@; cards; zhao 67 76 74 qian 89 78 92 sun 88 76 90 li 93 85 82 wang 78 64 72 xu 90 94 77 proc print; proc transpose; id name; /*用姓名来作为新数据集的变量名*/ proc print; run; 数据分组(重新编码) 在实际应用中,有时要将区间、比例测量水平的数据分成几个区间或几个组,便于做频数统计等分析。在SAS中除了利用If语句(如在Analyst中)生成分组变量外,也可用FORMAT过程,实现对数据的重新分组编码。 FORMAT过程的一般用法格式: proc format [选项]; [value 格式名 变量的原取值范围=输出值 …;] [invalue 格式名 变量的原取值范围=要被转换成的值 …;] [……] /* 可以使用多个VALUE、INVALUE语句*/ [run;] 功能:用于对字符或数值变量定义用户自己的输入输出格式。 FORMAT过程选项 ◎PROC FORMAT语句表示开始自定义变量的格式 常用选项有: CNTLIN=数据集 指定数据集保存输入格式的控制信息; CNTLOUT

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档