第3章节SAS数据步与数据步语句.docVIP

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 数据步与数据步语句 摘要:本章讲授数据步的基本概念,数据集的结构,学习数据步构成的有关语句功能及其用法。对本章内容的学习是进行数据处理的一个前提条件,为后面编程打下基础。 §3.1 SAS数据步与数据集 §3.1.1数据步 数据步是产生数据集的一组语句,一个数据步可以建立一个或多个数据集,在一个SAS程序中可以有多个数据步。数据步程序还可以对已经建立的数据集进行修改和产生输出报告。 一、数据步的基本任务 ⒈ 建立数据集: SAS按照从数据步各语句中获得的信息建立数据集,该数据集存放输出的数据,故称输出数据集。DATA语句是数据步开始的标志,且提供数据集名。格式如下: DATA 数据集名; ⒉ 输入数据: 把外部数据读入内存,这步取决于外部数据的来源,可分为三种情况。 从数据步内读取数据(数据源在作业流中): 用 INPUT 语句 与 CARDS 语句 联合使用 从磁盘文件读取数据: 用 INFILE 语句 与 INPUT 语句 联合使用 从已有的数据集中读取数据: 用 SET 语句 ⒊ 对数据进行加工: 对数据进行加工处理的语句叫多,后面陆续介绍。在此仅介绍赋值语句。 赋值语句格式: 变量=算术表达式 变量=字符串 赋值语句功能:先计算赋值号右边的表达式的值,然后将表达式的值赋给右边的变量。如: x=3+6 ⒋ 将组成的观察写入数据集: 在完成数据加工后,将要保存的变量(及数据)组成一例观察值,写入数据集。该操作用OUTPUT语句来完成。 二、数据步程序的三种结构 根据数据源的不同,数据步程序有如下三种基本结构: ⒈ 从数据步内读取数据(数据源在作业流中): 当数据源的数据作为程序的一部分出现在程序中时,数据步程序的格式如下: DATA 数据集名; INPUT 变量表; [其它数据步语句;] CARDS; 数据块 ; ⒉ 从磁盘文件读取数据(数据源是ASCII码文件): 如果数据源是以ASCII码数据文件存储于磁盘上,SAS可以读取该数据文件中的数据来建立数据集,则数据步具有的格式如下: DATA 数据集名; INFILE 数据文件名; INPUT 变量表; [其它数据步语句;] ; 执行INFILE语句时,指定的数据文件被打开,INPUT语句从打开的数据文件中读取数据。 ⒊ 从已有的数据集中读取数据:(数据源是已经存在的数据集) 利用已经建立的数据集中的数据来产生新的数据集,其数据步格式如下: DATA 数据集名; SET 或MERGE或UPDATA语句; [其它数据步语句;] ; 三、数据步的程序的执行流程 数据步的作用是把数据源中的数据作为输入,经过加工后输出到一个或多个“SAS数据集”。程序执行流程图如下: §3.1.2数据集 SAS数据集是一种具有特定专门格式的,且有SAS程序运行产生的,SAS使用的一种数据文件(以二进制形式存放)。它由数据步产生,作为过程步的输入。 数据集的结构 数据集是一个数值的集合,是一个数据值构成的矩形表(二维表)。 观测 变量1 变量2 变量4 … 1 数据值 数据值 数据值 … 2 数据值 数据值 数据值 … 3 数据值 数据值 数据值 … ∶ ∶ ∶ ∶ ∶ ∶ ∶ ∶ ∶ ∶ 数据集中的数据是按行列结构存放: 每一行代表调查的每一个个体的信息,称之为:观测值(Observations样本、记录); 每一列表示一个调查项目,称为变量(Variables);每一列上的数据值称为变量值(Data value)。 数据集的基本要素是变量和观测值。 数据集的类型 SAS数据集分为两种类型:临时数据集和永久数据集。 SAS数据集名称由两部分组成。两部分名称是以“·”为分隔符连接而成的。其格式如下: 一级名·二级名 ⒈ 临时数据集 当以“WORK”作为一级名,或省略一级名仅使用二级名,则该数据集为临时数据集。这类数据集在SAS退出时回被系统自动删除。 临时数据集创建方法有两种: 用户自定义:用户给定数据集名。 如:“DATA student;”,建立的数据集为Work.student。 由系统自定义:由系统指定数据集名。 如:“DATA;”系统以DATA1,DATA2……等命名。 ⒉ 永久数据集 若想在保存建立的数据集,则需要建立永久数据集。即一级名不能省略且不为“WORK”的数据集。SAS数据集名中不能使用真实路径,必须用LIBNAME语句给数据集指定一个别名(逻辑名)。 在DATA语句中,以逻辑名为一级名,就可以建立永久数据集。SAS系统回自动为永久数据集文件加上“.Sd2”扩展名。如: libname sjm C:\sas\SASWORK; data sjm.student; input xh$ xm$ yy gs;

您可能关注的文档

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档