- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 数据步与数据步语句
摘要:本章讲授数据步的基本概念,数据集的结构,学习数据步构成的有关语句功能及其用法。对本章内容的学习是进行数据处理的一个前提条件,为后面编程打下基础。
§3.1 SAS数据步与数据集
§3.1.1数据步
数据步是产生数据集的一组语句,一个数据步可以建立一个或多个数据集,在一个SAS程序中可以有多个数据步。数据步程序还可以对已经建立的数据集进行修改和产生输出报告。
一、数据步的基本任务
⒈ 建立数据集:
SAS按照从数据步各语句中获得的信息建立数据集,该数据集存放输出的数据,故称输出数据集。DATA语句是数据步开始的标志,且提供数据集名。格式如下:
DATA 数据集名;
⒉ 输入数据:
把外部数据读入内存,这步取决于外部数据的来源,可分为三种情况。
从数据步内读取数据(数据源在作业流中):
用 INPUT 语句 与
CARDS 语句 联合使用
从磁盘文件读取数据:
用 INFILE 语句 与
INPUT 语句 联合使用
从已有的数据集中读取数据:
用 SET 语句
⒊ 对数据进行加工:
对数据进行加工处理的语句叫多,后面陆续介绍。在此仅介绍赋值语句。
赋值语句格式:
变量=算术表达式
变量=字符串
赋值语句功能:先计算赋值号右边的表达式的值,然后将表达式的值赋给右边的变量。如:
x=3+6
⒋ 将组成的观察写入数据集:
在完成数据加工后,将要保存的变量(及数据)组成一例观察值,写入数据集。该操作用OUTPUT语句来完成。
二、数据步程序的三种结构
根据数据源的不同,数据步程序有如下三种基本结构:
⒈ 从数据步内读取数据(数据源在作业流中):
当数据源的数据作为程序的一部分出现在程序中时,数据步程序的格式如下:
DATA 数据集名;
INPUT 变量表;
[其它数据步语句;]
CARDS;
数据块
;
⒉ 从磁盘文件读取数据(数据源是ASCII码文件):
如果数据源是以ASCII码数据文件存储于磁盘上,SAS可以读取该数据文件中的数据来建立数据集,则数据步具有的格式如下:
DATA 数据集名;
INFILE 数据文件名;
INPUT 变量表;
[其它数据步语句;]
;
执行INFILE语句时,指定的数据文件被打开,INPUT语句从打开的数据文件中读取数据。
⒊ 从已有的数据集中读取数据:(数据源是已经存在的数据集)
利用已经建立的数据集中的数据来产生新的数据集,其数据步格式如下:
DATA 数据集名;
SET 或MERGE或UPDATA语句;
[其它数据步语句;]
;
三、数据步的程序的执行流程
数据步的作用是把数据源中的数据作为输入,经过加工后输出到一个或多个“SAS数据集”。程序执行流程图如下:
§3.1.2数据集
SAS数据集是一种具有特定专门格式的,且有SAS程序运行产生的,SAS使用的一种数据文件(以二进制形式存放)。它由数据步产生,作为过程步的输入。
数据集的结构
数据集是一个数值的集合,是一个数据值构成的矩形表(二维表)。
观测 变量1 变量2 变量4 … 1 数据值 数据值 数据值 … 2 数据值 数据值 数据值 … 3 数据值 数据值 数据值 … ∶
∶ ∶
∶ ∶
∶ ∶
∶ ∶
∶ 数据集中的数据是按行列结构存放:
每一行代表调查的每一个个体的信息,称之为:观测值(Observations样本、记录);
每一列表示一个调查项目,称为变量(Variables);每一列上的数据值称为变量值(Data value)。
数据集的基本要素是变量和观测值。
数据集的类型
SAS数据集分为两种类型:临时数据集和永久数据集。
SAS数据集名称由两部分组成。两部分名称是以“·”为分隔符连接而成的。其格式如下:
一级名·二级名
⒈ 临时数据集
当以“WORK”作为一级名,或省略一级名仅使用二级名,则该数据集为临时数据集。这类数据集在SAS退出时回被系统自动删除。
临时数据集创建方法有两种:
用户自定义:用户给定数据集名。
如:“DATA student;”,建立的数据集为Work.student。
由系统自定义:由系统指定数据集名。
如:“DATA;”系统以DATA1,DATA2……等命名。
⒉ 永久数据集
若想在保存建立的数据集,则需要建立永久数据集。即一级名不能省略且不为“WORK”的数据集。SAS数据集名中不能使用真实路径,必须用LIBNAME语句给数据集指定一个别名(逻辑名)。
在DATA语句中,以逻辑名为一级名,就可以建立永久数据集。SAS系统回自动为永久数据集文件加上“.Sd2”扩展名。如:
libname sjm C:\sas\SASWORK;
data sjm.student;
input xh$ xm$ yy gs;
您可能关注的文档
- 八学年思想品德复习MicrosoftPowerPoint演示文稿.ppt
- 符合国标规范的“单位工程施工组织设计”.doc
- 学校卫生与学生常见病预防控制工作规范.doc
- 第007章节控制ABAP.doc
- 八学年政治上册单元评价检测课件.ppt
- 学校卫生宣传林料常识.doc
- 第02章节像素的概念.doc
- 第02讲 函数概念和表示.doc
- 学校卫生检记查录.doc
- 第03章节企业架构模型.docx
- 基于人工智能教育平台的移动应用开发,探讨跨平台兼容性影响因素及优化策略教学研究课题报告.docx
- 高中生物实验:城市热岛效应对城市生态系统服务功能的影响机制教学研究课题报告.docx
- 信息技术行业信息安全法律法规研究及政策建议教学研究课题报告.docx
- 人工智能视角下区域教育评价改革:利益相关者互动与政策支持研究教学研究课题报告.docx
- 6 《垃圾填埋场渗滤液处理与土地资源化利用研究》教学研究课题报告.docx
- 小学音乐与美术教师跨学科协作模式构建:人工智能技术助力教学创新教学研究课题报告.docx
- 《航空航天3D打印技术对航空器装配工艺的创新与效率提升》教学研究课题报告.docx
- 教育扶贫精准化策略研究:人工智能技术在区域教育中的应用与创新教学研究课题报告.docx
- 《区块链技术在电子政务电子档案管理中的数据完整性保障与优化》教学研究课题报告.docx
- 《中医护理情志疗法对癌症患者心理状态和生活质量提升的长期追踪研究》教学研究课题报告.docx
文档评论(0)