- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3-
3- PAGE #
第 3 章 数据步与数据步语句
摘要:本章讲授数据步的基本概念,数据集的结构,学习数据步构成的有关语 句功能及其用法。对本章内容的学习是进行数据处理的一个前提条件,为后面编程 打下基础。
§3.1 SAS 数据步与数据集
§ 3.1.1 数据步
数据步是产生数据集的一组语句,一个数据步可以建立一个或多个数据集,在 一个 SAS 程序中可以有多个数据步。 数据步程序还可以对已经建立的数据集进行修 改和产生输出报告。
一、数据步的基本任务
建立数据集:
SAS 按照从数据步各语句中获得的信息建立数据集, 该数据集存放输出的数据, 故称输出数据集。 DATA 语句是数据步开始的标志,且提供数据集名。格式如下:
DATA 数据集名;
输入数据:
把外部数据读入内存,这步取决于外部数据的来源,可分为三种情况。
从数据步内读取数据(数据源在作业流中) :
用 INPUT 语句 与
CARDS 语句 联合使用
从磁盘文件读取数据:
用 INFILE 语句 与
INPUT 语句 联合使用
从已有的数据集中读取数据:
用 SET 语句
对数据进行加工:
对数据进行加工处理的语句叫多,后面陆续介绍。在此仅介绍赋值语句。 赋值语句格式:
变量 =算术表达式
变量 =字符串
赋值语句功能: 先计算赋值号右边的表达式的值,然后将表达式的值赋给右边 的变量。如 :
x=3+6
将组成的观察写入数据集: 在完成数据加工后,将要保存的变量(及数据)组成一例观察值,写入数据集。
该操作用 OUTPUT 语句来完成。
二、 数据步程序的三种结构
根据数据源的不同,数据步程序有如下三种基本结构:
从数据步内读取数据(数据源在作业流中) :
当数据源的数据作为程序的一部分出现在程序中时,数据步程序的格式如下: DATA 数据集名;
INPUT 变量表; [ 其它数据步语句; ]
CARDS ;
数据块
;
从磁盘文件读取数据(数据源是 ASCII码文件):
如果数据源是以 ASCII 码数据文件存储于磁盘上, SAS 可以读取该数据文件中 的数据来建立数据集,则数据步具有的格式如下:
DATA 数据集名; INFILE 数据文件名; INPUT 变量表; [ 其它数据步语句; ] ;
执行 INFILE 语句时,指定的数据文件被打开, INPUT 语句从打开的数据文件 中读取数据。
从已有的数据集中读取数据 :(数据源是已经存在的数据集)
利用已经建立的数据集中的数据来产生新的数据集,其数据步格式如下: DATA 数据集名;
SET 或 MERGE 或 UPDATA 语句;
[ 其它数据步语句; ]
;
三、 数据步的程序的执行流程
数据步的作用是把数据源中的数据作为输入,经过加工后输出到一个或多个
“ SAS 数据集”。程序执行流程图如下:
§ 3.1.2数据集
SAS数据集是一种具有特定专门格式的, 且有SAS程序运行产生的,SAS使用
的一种数据文件(以二进制形式存放) 。它由数据步产生,作为过程步的输入。
一、数据集的结构
数据集是一个数值的集合,是一个数据值构成的矩形表(二维表) 。
观测
变量1
变量2
变量4
1
数据值
数据值
数据值
2
数据值
数据值
数据值
3
数据值
数据值
数据值
数据集中的数据是按行列结构存放:
每一行代表调查的每一个个体的信息, 称之为:观测值(Observations样本、
记录);
每一列表示一个调查项目,称为变量( Variables);每一列上的数据值称为 变量值(Data value )。
数据集的基本要素是变量和观测值。
二、数据集的类型
SAS 数据集分为两种类型:临时数据集和永久数据集。
SAS数据集名称由两部分组成。两部分名称是以“ ? ”为分隔符连接而成的。其
格式如下:
一级名?二级名
1?临时数据集
当以“ WORK ”作为一级名,或省略一级名仅使用二级名,则该数据集为临时 数据集。这类数据集在 SAS 退出时回被系统自动删除。
临时数据集创建方法有两种:
用户自定义:用户给定数据集名。
女口: “DATA student;”,建立的数据集为 Work.student。
由系统自定义:由系统指定数据集名。
女口: “DATA ; 系统以 DATA1 , DATA2……等命名。
永久数据集 若想在保存建立的数据集,则需要建立永久数据集。即一级名不能省略且不为
“ WORK ”的数据集。 SAS 数据集名中不能使用真实路径,必须用 LIBNAME 语句 给数据集指定一个别名(逻辑名) 。
在 DATA 语句中,以逻辑名为一级名,就可以建立永久数据集。 SAS 系统回自
动为永久数据集文件加上“? Sd2”扩展名。如:
libname sjm C:\sas\SASWORK
文档评论(0)