- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《第3章SAS数据步与数据步语句
第3章 数据步与数据步语句
摘要:本章讲授数据步的基本概念,数据集的结构,学习数据步构成的有关语句功能及其用法。对本章内容的学习是进行数据处理的一个前提条件,为后面编程打下基础。
§3.1 SAS数据步与数据集
§3.1.1数据步
数据步是产生数据集的一组语句,一个数据步可以建立一个或多个数据集,在一个SAS程序中可以有多个数据步。数据步程序还可以对已经建立的数据集进行修改和产生输出报告。
一、数据步的基本任务
⒈ 建立数据集:
SAS按照从数据步各语句中获得的信息建立数据集,该数据集存放输出的数据,故称输出数据集。DATA语句是数据步开始的标志,且提供数据集名。格式如下:
DATA 数据集名;
⒉ 输入数据:
把外部数据读入内存,这步取决于外部数据的来源,可分为三种情况。
从数据步内读取数据(数据源在作业流中):
用 INPUT 语句 与
CARDS 语句 联合使用
从磁盘文件读取数据:
用 INFILE 语句 与
INPUT 语句 联合使用
从已有的数据集中读取数据:
用 SET 语句
⒊ 对数据进行加工:
对数据进行加工处理的语句叫多,后面陆续介绍。在此仅介绍赋值语句。
赋值语句格式:
变量=算术表达式
变量=字符串
赋值语句功能:先计算赋值号右边的表达式的值,然后将表达式的值赋给右边的变量。如:
x=3+6
⒋ 将组成的观察写入数据集:
在完成数据加工后,将要保存的变量(及数据)组成一例观察值,写入数据集。该操作用OUTPUT语句来完成。
二、数据步程序的三种结构
根据数据源的不同,数据步程序有如下三种基本结构:
⒈ 从数据步内读取数据(数据源在作业流中):
当数据源的数据作为程序的一部分出现在程序中时,数据步程序的格式如下:
DATA 数据集名;
INPUT 变量表;
[其它数据步语句;]
CARDS;
数据块
;
⒉ 从磁盘文件读取数据(数据源是ASCII码文件):
如果数据源是以ASCII码数据文件存储于磁盘上,SAS可以读取该数据文件中的数据来建立数据集,则数据步具有的格式如下:
DATA 数据集名;
INFILE 数据文件名;
INPUT 变量表;
[其它数据步语句;]
;
执行INFILE语句时,指定的数据文件被打开,INPUT语句从打开的数据文件中读取数据。
⒊ 从已有的数据集中读取数据:(数据源是已经存在的数据集)
利用已经建立的数据集中的数据来产生新的数据集,其数据步格式如下:
DATA 数据集名;
SET 或MERGE或UPDATA语句;
[其它数据步语句;]
;
三、数据步的程序的执行流程
数据步的作用是把数据源中的数据作为输入,经过加工后输出到一个或多个“SAS数据集”。程序执行流程图如下:
§3.1.2数据集
SAS数据集是一种具有特定专门格式的,且有SAS程序运行产生的,SAS使用的一种数据文件(以二进制形式存放)。它由数据步产生,作为过程步的输入。
数据集的结构
数据集是一个数值的集合,是一个数据值构成的矩形表(二维表)。
观测 变量1 变量2 变量4 … 1 数据值 数据值 数据值 … 2 数据值 数据值 数据值 … 3 数据值 数据值 数据值 … ∶
∶ ∶
∶ ∶
∶ ∶
∶ ∶
∶ 数据集中的数据是按行列结构存放:
每一行代表调查的每一个个体的信息,称之为:观测值(Observations样本、记录);
每一列表示一个调查项目,称为变量(Variables);每一列上的数据值称为变量值(Data value)。
数据集的基本要素是变量和观测值。
数据集的类型
SAS数据集分为两种类型:临时数据集和永久数据集。
SAS数据集名称由两部分组成。两部分名称是以“·”为分隔符连接而成的。其格式如下:
一级名·二级名
⒈ 临时数据集
当以“WORK”作为一级名,或省略一级名仅使用二级名,则该数据集为临时数据集。这类数据集在SAS退出时回被系统自动删除。
临时数据集创建方法有两种:
用户自定义:用户给定数据集名。
如:“DATA student;”,建立的数据集为Work.student。
由系统自定义:由系统指定数据集名。
如:“DATA;”系统以DATA1,DATA2……等命名。
⒉ 永久数据集
若想在保存建立的数据集,则需要建立永久数据集。即一级名不能省略且不为“WORK”的数据集。SAS数据集名中不能使用真实路径,必须用LIBNAME语句给数据集指定一个别名(逻辑名)。
在DATA语句中,以逻辑名为一级名,就可以建立永久数据集。SAS系统回自动为永久数据集文件加上“.Sd2”扩展名。如:
libname sjm C:\sas\SASWORK;
data sjm.student;
input xh$ xm$ yy gs;
您可能关注的文档
最近下载
- 2025最新高级生命支持(ACLS)理论考核试题及答案.docx VIP
- T∕CCSAS 001-2018 危险与可操作性分析质量控制与审查导则.pdf
- 07J912-1变配电所图集.pdf VIP
- 基于PLC控制的小车自动化送料系统设计(毕业论文).doc VIP
- 2025北京海淀高一(下)期末数学试卷含答案.pdf VIP
- 中国社会的不婚现象:现实与潜在影响探讨.docx VIP
- 2025最新高级生命支持(ACLS)理论考核试题和答案.docx
- 5.2《稻》《作酢法》+二则(知识清单)-【中职专用】高二语文(高教版2023拓展模块下册).docx VIP
- 2025年非车险考试题 .pdf VIP
- GB50016-2014 建筑设计防火规范(2018年版).docx
文档评论(0)