Ch3 SAS数据步(DATA Step).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Ch3 SAS数据步(DATA Step)

第三章 SAS数据步(DATA Step) SAS数据步作用  数据步在SAS系统中具有十分重要的地位,概括起来其内容主要有: 录入数据并转化为SAS数据集; 编辑数据,包括检查和修改数据中的错误、计算新变量等; 将数据写入磁盘; 对已有的数据集进行管理。如取子集、合并及更新数据集等。 对数据的灵活操作是SAS的一大优势。 §1 SAS数据步(DATA STEP) 利用SAS系统对数据进行统计分析,必须以SAS数据集为基础。因而在进行分析之前必须先将要处理的数据按SAS系统的格式存放在一个数据文件中,这个过程就是建立SAS数据集。 SAS数据集实质上是一张关系型数据表,即通常所见到的二维表格,一行表示一个观察(Observation),一列表示一个变量(Variable),行列的交叉点就是该观察在该变量上的取值。参见下页示意图。 SAS数据集分为两类: 一类是临时数据集,另一类是永久数据集。 一. 临时数据集的建立 在SAS系统运行期间,临时数据集一经建立,则该临时数据集一直存在;如果用户退出SAS系统,则临时数据集立即被删除。用户重新进入SAS系统后则不能再调用这些已被删除的临时数据集了。 临时数据集存放在SAS的Work库里面。 根据数据的存在形式,临时数据集的建立可分为以下几种情况: 1.数据在作业流中(即程序之中) 一般的形式如下: DATA语句; INPUT语句; (用于DATA步的其它SAS语句) CARDS语句; [数据行] ; RUN; 例1就是直接用SAS语句从作业流中输入数据,从而建立所需要的SAS数据集的一个例子。 2.数据在外部文本文件中 从外部文本文件中读入数据来建立SAS数据集的一般形式为: DATA语句; INFILE语句; INPUT语句; (用于DATA步的其它SAS语句) RUN语句; 需要注意两点: 不需要CARDS语句。 INFILE语句的作用是打开一个外部文本文件,其格式为: INFILE ’文件说明’; 这里,文件说明是指所要引用的外部文件所在的磁盘路径和文件全名,应用单引号(或双引号)将文件说明括起来。 例2:在‘c:\mydata\’子目录下存放有一个名为id.txt的文件,内容如下:(第一列为姓名,第二列为电话) 注意: 要求数据之间是以空格作为分隔符来分隔的。 如果不是以空格则需要指定选项。 常见的有: 制表符分隔(常见于直接从excel拷贝数据到文本文件中) 此时在infile语句中添加选项 expandtabs 其它可见符号,如逗号(,)等, 此时在infile语句中添加选项 dlm=‘分隔符’,如dlm=‘,’ 3.数据来自其它SAS数据集 从已存在的SAS数据集产生新的SAS数据集的一般形式为: DATA语句; SET 语句; (DATA步的其它SAS语句) RUN; 例3:从SAS数据集b中选择年龄小于5岁的存放到数据集c中。 data c; Set b; if age 5; run; 4.直接从其它数据库导入 常见的格式有: Excel 格式数据 (*.xls) Access格式数据(*.mdb) DBF格式数据(*.dbf) 文本文件格式数据(*.txt) 导入方法: File?Import data…?然后依次按要求选择 例如:data da1; input x1 x2 x3; y=x1+x2+x3; cards; 3 1.2 0.5 2 2.4 0.9 5 3.2 0.8 8 4.1 1.1 7 3.3 0.6 ; Run; 二.建立数据集的相关语句 1.DATA语句 DATA语句表示一个数据步的开始,并给出正被创建的SAS数据集的名字。 语句格式: DATA [名字1]

文档评论(0)

ay8088 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档