第3章SAS数据步与数据步语句.docxVIP

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3- 3- PAGE # 第 3 章 数据步与数据步语句 摘要:本章讲授数据步的基本概念,数据集的结构,学习数据步构成的有关语 句功能及其用法。对本章内容的学习是进行数据处理的一个前提条件,为后面编程 打下基础。 §3.1 SAS 数据步与数据集 § 3.1.1 数据步 数据步是产生数据集的一组语句,一个数据步可以建立一个或多个数据集,在 一个 SAS 程序中可以有多个数据步。 数据步程序还可以对已经建立的数据集进行修 改和产生输出报告。 一、数据步的基本任务 建立数据集: SAS 按照从数据步各语句中获得的信息建立数据集, 该数据集存放输出的数据, 故称输出数据集。 DATA 语句是数据步开始的标志,且提供数据集名。格式如下: DATA 数据集名; 输入数据: 把外部数据读入内存,这步取决于外部数据的来源,可分为三种情况。 从数据步内读取数据(数据源在作业流中) : 用 INPUT 语句 与 CARDS 语句 联合使用 从磁盘文件读取数据: 用 INFILE 语句 与 INPUT 语句 联合使用 从已有的数据集中读取数据: 用 SET 语句 对数据进行加工: 对数据进行加工处理的语句叫多,后面陆续介绍。在此仅介绍赋值语句。 赋值语句格式: 变量 =算术表达式 变量 =字符串 赋值语句功能: 先计算赋值号右边的表达式的值,然后将表达式的值赋给右边 的变量。如 : x=3+6 将组成的观察写入数据集: 在完成数据加工后,将要保存的变量(及数据)组成一例观察值,写入数据集。 该操作用 OUTPUT 语句来完成。 二、 数据步程序的三种结构 根据数据源的不同,数据步程序有如下三种基本结构: 从数据步内读取数据(数据源在作业流中) : 当数据源的数据作为程序的一部分出现在程序中时,数据步程序的格式如下: DATA 数据集名; INPUT 变量表; [ 其它数据步语句; ] CARDS ; 数据块 ; 从磁盘文件读取数据(数据源是 ASCII码文件): 如果数据源是以 ASCII 码数据文件存储于磁盘上, SAS 可以读取该数据文件中 的数据来建立数据集,则数据步具有的格式如下: DATA 数据集名; INFILE 数据文件名; INPUT 变量表; [ 其它数据步语句; ] ; 执行 INFILE 语句时,指定的数据文件被打开, INPUT 语句从打开的数据文件 中读取数据。 从已有的数据集中读取数据 :(数据源是已经存在的数据集) 利用已经建立的数据集中的数据来产生新的数据集,其数据步格式如下: DATA 数据集名; SET 或 MERGE 或 UPDATA 语句; [ 其它数据步语句; ] ; 三、 数据步的程序的执行流程 数据步的作用是把数据源中的数据作为输入,经过加工后输出到一个或多个 “ SAS 数据集”。程序执行流程图如下: § 3.1.2数据集 SAS数据集是一种具有特定专门格式的, 且有SAS程序运行产生的,SAS使用 的一种数据文件(以二进制形式存放) 。它由数据步产生,作为过程步的输入。 一、数据集的结构 数据集是一个数值的集合,是一个数据值构成的矩形表(二维表) 。 观测 变量1 变量2 变量4 1 数据值 数据值 数据值 2 数据值 数据值 数据值 3 数据值 数据值 数据值 数据集中的数据是按行列结构存放: 每一行代表调查的每一个个体的信息, 称之为:观测值(Observations样本、 记录); 每一列表示一个调查项目,称为变量( Variables);每一列上的数据值称为 变量值(Data value )。 数据集的基本要素是变量和观测值。 二、数据集的类型 SAS 数据集分为两种类型:临时数据集和永久数据集。 SAS数据集名称由两部分组成。两部分名称是以“ ? ”为分隔符连接而成的。其 格式如下: 一级名?二级名 1?临时数据集 当以“ WORK ”作为一级名,或省略一级名仅使用二级名,则该数据集为临时 数据集。这类数据集在 SAS 退出时回被系统自动删除。 临时数据集创建方法有两种: 用户自定义:用户给定数据集名。 女口: “DATA student;”,建立的数据集为 Work.student。 由系统自定义:由系统指定数据集名。 女口: “DATA ; 系统以 DATA1 , DATA2……等命名。 永久数据集 若想在保存建立的数据集,则需要建立永久数据集。即一级名不能省略且不为 “ WORK ”的数据集。 SAS 数据集名中不能使用真实路径,必须用 LIBNAME 语句 给数据集指定一个别名(逻辑名) 。 在 DATA 语句中,以逻辑名为一级名,就可以建立永久数据集。 SAS 系统回自 动为永久数据集文件加上“? Sd2”扩展名。如: libname sjm C:\sas\SASWORK

文档评论(0)

cooldemon0601 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档