- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章[SAS过程中常用语句]
第六章 SAS过程中常用语句
要对数据进行分析和处理,需在过程中使用一些过程步语句和有关的选择项。本章介绍SAS过程步中通用语句,对有些过程步的专用语句和选择项将在后面各过程中介绍。
第一节 PROC语句
语句格式:
PROC SAS过程名 [选择项];
功能:指定所需调用的过程以及该过程的若干选择项。
PROC语句中有三种类型的选择项用于各过程步:
(1)关键字 规定反映本过程特征的关键字。
(2)关键字=值 规定初值,该值可是数字或字符串。
(3)关键字=SAS数据集 规定输入或输出的数据集。最常用的是DATA一数据集,指出本过程所要处理的数据集名,如缺省则处理最新建立的数据集。
例PRINT过程,打印数据集AA的内容。
PROC PRINT DATA=A;
第二节 BY 语句
语句格式:
BY [DESCENDING] 变量… [NOTSORTED];
功能:以指定的变量值来分组处理某数据集。
BY语句总是首先与S0RT(分类)过程一起使用,以便定义数据排列次序。当BY语句在其它大多数对SAS数据集作分析的过程中使用时,能分别处理每一个分组(BY)的观测值。这里的变量是数据集中的用作分组的变量,以这个变量按指定要求排序(分类)。
选择项DESCENDING要求紧接的变量按降序排列数据集中各观测值,NOTSORTED要求进行分组时,各组不需按字母或数字顺序排序。例如:
BY DESCENDING AGE;
本语句按变量AGE(年龄)值对数据集进行降序排序。
假设有一数据集CLASS包含有变量DAY的观测值,DAY值是一周内某天的三个字符缩写形式(如,MON,TUE…)将数据集中具有相同DAY值的观测值分为一组,DAY的值是按日历顺序而不是字母顺序排列的。下面的语句可以和一个PROC语句一起使用,按DAY分组处理数据集。
BY DAY NOTSORTED;
(不排序,但按指定变量值将同类放一起)
如DESCENDING和NOTSORTED都没指定,那么数据集中的观测值一定会按BY变量值的升序安排。
例下面程序对AA数据集按SEX变量值升序排列,并在同一SEX组内对AGE值进行降序排列,并按SEX变量分组打印。
PROC SORT DATA=AA; (yp52.sas)
BY SEX DESCENDING AGE;
PROC PRINT;
BY SEX;
第三节 CLASS 语句
语句格式:
CLASS 变量表;
功能:定义分类变量。
分类变量只有少数的几个离散值或者不连续值,可以是字符型或数值型。在CLASS语句中,按指定变量的值进行分组。CLASS语句对计算统计的作用类似于BY语句。它们之间的不同是打印输出的格式,并且BY语句要求先排序。
第四节 VAR 语句
语句格式:
VAR 变量表;
功能:用于定义分析变量。
语句中变量为要作分析的数据集中的变量,任何有效的变量清单形式均可被使用。当该语句省略时,对所有变量做统计计算。
例下面语句按SEX值的分组对VAR所标识的H变量进行分析产生两个单独的描述性统计报告。
PROC MEANS DATA=AA;
BY SEX;
VAR H;
第五节 WEIGHT 语句
语句格式:
WEIGHT 变量;
功能:在过程中规定一个数值变量,并以它的值作为观测值的权重。
例:假设一个数据集包括了变量GROP(X,Y两组)、SEX(F为女,M为男)和HRSWORK。下面程序产生一个表格,显示各组不同性别人所工作的时间数等等。
DATA GSH; INPUT GROP $ SEX $ HRSWORK;
CARDS;
X F 5.8
Y F 6.4
X M 7.2
Y M 7.0
;
PROC FREQ;
TABLES GROP*SEX;WEIGHT HRSWORK;
第六节 FREQ 语句
语句格式:
FREQ 变量;
功能:规定一个数值变量,它的值表示工作数据集中观测值出现的频数。
假定某观测值的FREQ变量值为n,则在分析时,数据集中的该观测值被视作出现的频数为n。当nl时,观测值不加以计算;若n不是整数,则自动取整。观测值数被认为等于FREQ变量的和。例如:
DATA
文档评论(0)