ch01_2-SAS编程初步.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ch01_2-SAS编程初步.ppt

一些语句既可用在数据步中,也可以用在过程步中 如,在生成数据集的DATA数据步中 ,可用format语句规定变量的输出格式,用label语句规定变量名标签,用length语句规定变量的存储长度。。。 语句用在数据步/过程步中是有区别的: 在数据步中规定的变量属性是附属于数据集本身的,是永久的; 在过程步中规定的变量属性只是用于该过程的本次运行 过程步PROC SAS过程步的一般形式 PROC 过程名 [DATA=输入数据集] [选项]; 过程语句/选项; 过程语句/选项; RUN; proc print data=class; run; /*在输出窗口显示数据集class*/ 常用过程步和语句 输出列表过程PRINT PRINT过程是最常用的SAS过程之一,在生成一个数据集之后,如果不是太大,一般都用PRINT过程来列出数据集的内容,这样可以检查变量与值之间的对应是否正确,数据输入是否正确。其语法格式为: PROC PRINT [DATA = 数据集] [NOOBS]; [VAR 变量列表;] [WHERE 表达式;] RUN; PROC PRINT [DATA = 数据集] [NOOBS]; [VAR 变量列表;] [WHERE 表达式;] RUN; 其中: 1) 在PROC语句中使用“DATA=选项”指定要列表的数据集名;NOOBS选项指定不输出观测号; 2) VAR语句可以指定要列出的变量并指定顺序 3) WHERE语句可以从输入数据集中选一个子集来处理 (1) VAR语句 VAR语句在很多过程中用来指定分析变量,其格式为: VAR 变量名1 变量名2 ... 变量名n; Proc print data=class; Var name age height; Run; (2) BY语句 BY语句在过程中一般用来指定一个或几个分类变量,根据这些分类变量值把观测分组,然后对每一组观测分别进行本过程指定的分析。其格式为: BY 变量名1 变量名2 ...; 在使用带有BY语句的过程步之前,一般先用SORT过程按by语句指定的变量对数据集排序。 如:已把class数据集按性别排序,则下面print过程可以把男女生分别列出: Proc print data=class; By sex; Run; (3) WHERE语句 用WHERE语句可以选择输入数据集的一个行子集来进行分析,在WHERE关键字后指定一个条件。其格式为: WHERE 条件; 如:where math=60 and chinese=60; where sex=‘女’; (4) FORMAT语句 过程步中的FORMAT语句可以为变量输出规定一个输出格式,比如: proc print data=c200501; format math 9.1 chinese 9.1; run; 使得列出的数学、语文成绩宽度占9位,带一位小数。 又如前例: (5) LABEL语句 LABEL语句为变量指定一个临时标签,很多过程可以使用这样的标签。LABEL语句的格式为: LABEL 变量名=标签 变量名=标签...; 注意 为使标号有效输出,需在Print过程语句中加Label选项。 见书例P28 数据排序过程SORT 在SAS过程中用BY语句可以把观测分类进行处理,但在此之前需要先用SORT过程排序。SORT过程可以把数据集按某一个或若干个变量的次序进行排序。其语法格式为: PROC SORT [DATA = 数据集] [OUT = 输出数据集名]; [BY 变量列表;] RUN; 其中DATA选项指定的数据集为输入数据集,OUT选项指定的数据集为输出数据集。 BY语句中在一个变量名前面加上DESCENDING关键字表示此变量的排序是由大到小的。 格式化过程FORMAT FORMAT过程可以定义数据的输出格式,对变量的不同值或不同范围的值设定不同的“变量值标签”来显示,其定义格式如下: PROC FORMAT; VALUE 格式名 范围1 = 标签1 范围2 = 标签2 ……; RUN; 其中格式名的命名规则与逻辑库名相同,由用户自已定义 先定义,再引用,引用格式: PROC 过程名 DATA=数据集名; 过程语句; FORMAT 数据集中的变量名 格式名.; RUN; [例] Proc format; Value $f_sex ‘F’=‘女’ ‘M’=‘男’; Run; Proc print data=class

文档评论(0)

xinshengwencai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5311233133000002

1亿VIP精品文档

相关文档