网站大量收购独家精品文档,联系QQ:2885784924

the-little-sas-book学习笔记(全部章节).docVIP

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第一章

1、每一个SAS语句都由一个分号结尾

2、SAS语句不区分大小写。

一条语句可以持续到第二行〔只要不把一个单词分开〕。

几条语句可以用一行。

可以在任何一列中开始一条语句

SAS数据集也被叫做表、观测值也被叫做行、变量也被叫做列。

在SAS中只有两种数据类型——数值型和字符型。

字符变量的缺失值用空格表示,数值变量的缺失值用句号〔.〕表示。

SAS命名规那么:

名字的长度要小于等于32个字节。〔一个字母1个字节,一个汉字2个字节〕

以字母或下划线开头。

可以包含字母、数字、或者是下划线,不能是%$!*#@。

可以是小写或大写字母,且不区分大小写。

程序的结束:当程序遭遇DATA\PROC等标志着新程序开始的语句时,程序结束。如果运行的是批处理,那么run代表语句的结束。

数据步按照一行一行、一个观测值一个观测值的顺序执行

OPTIONS语句既不属于数据步也不属于过程步。

10、导入数据

filenamemydata‘’;

datauspresidents;

infilemydata;

inputname$party$number;

run;

datauspresidents;

infileE:\president.txt;

inputname$party$number;

run;

第二章

INFILE语句

告诉SAS外部数据的文件名和存放路径,它在data语句之后,在INPUT语句之前。

2、Input语句

input最根本用法

读取空格分开的原始数据:你必须读取所有的数据记录,不能跳过某些值、缺失值必须用句号“.”代替。字符串数据不能包含空格、长度不能超过8个字符。

读取按固定列排列的原始数据:input关键字后接变量名、再接变量的列位置。

2.3.informats读取非标准格式的原始数据

$代表是字符串、informats代表形式〔比方日期的MMDDYY〕、w是宽度、d是小数点的位数、最后是句号“.”,缺少句号会使得SAS把形式〔如MMDDYY〕当做变量名

2.4:遇到空格继续读取或不继续读取

“:”。

@’[’作为列指示器,告诉SAS读取[之后的内容。

跨行观测值的读取方式

行指示器,斜线/:告诉SAS跳至原始数据的第二行;#n:跳至第n行,n代表原始数据中某观测值的行数〔#2那么让SAS跳至某观测值的第二行〕。

一行读取多个观测值

可以在input语句结尾加一个停止符号@@。

在input语句结尾加符号@,这告诉SAS先停在〔hold〕此行,同时用IF语句检测此观测值是否满足需要,如果是,那么可以再用一个input语句来读取现有的变量。。

2.9、@vs@@

@的作用类似于@@,都是行停留指示符〔line-holdspecifiers〕,不同地方在于停留多久,@能使SAS停留到下一个input语句〔也不换行〕,@@能使停留的时间到下一个data步〔也不换行〕。

3、用infile语句中的选项控制输入

3.1FIRSTOBS=

选项告诉SAS从哪一行开始读取数据

3.2OBS=

告诉SAS一直读取到哪一行位置

3.3MISSOVER

在input语句中输入的几个变量,SAS在观测值中就读取几个变量,如果一行未读完,那么进入下一行直到输入的变量都读取了变量值。missover可以让SAS不进入下一行读取,未赋值的变量就使其成为缺失值。

3.4Truncover

当每行的长度不一时,指定最长的列读取观测值,使得当读取短行的观测值时不会跳到下一行读取;

4、用数据步读取分隔符文件

4.1DLM=

指定空格以外的其他分隔符。如果是用制表符隔开的,那么可以使用DLM=’09’X来指定。

DSD

1.忽略引号中数据的分隔符,例如一个观测Joseph,76,RedRacers,Washington非引号中的逗号能识别成分隔符,而引号中的逗号不能识别;

2.自动将字符串中的引号去掉;

3.将两个相邻的分隔符当作缺失值来处理。〔并且,DSD默认分隔符为逗号,如果数据中的分隔符不是逗号,那么要用DLM来指定〕

5、用导入过程〔IMPORTprocedure〕读取分隔符文件

如果文件没有正确的扩展名,或者是DLM格式的,必须在procimport语句中用DBMS=option。如果想要创立的数据集名字已经存在,那么要用replace选项代替。

用LIBNAME语句使用永久数据集

LIBNAME语句

根本形式为:LIBNAME+库名+‘路径’;

7.查看SAS数据集的描述

Proccontentsdata=data-set

第三章

1、表达式创立新变量

2、使用SAS函数

DAY〔〕:返回一个月中的天数;upcase〔〕:将字

文档评论(0)

liuzhouzhong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档