- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 建立数据集 建立数据集 SAS系统中建立数据集的途径主要有三种: ●使用传统的SAS数据步程序 ●用SAS/FSP软件中的FSEDIT和FSVIEW过程 ●使用SAS/ACCESS软件访问其他的数据库 3.1 利用数据步程序建立SAS数据3.1.1 利用数据步创建SAS数据集的三种方式 1. 从程序中直接读入数据 ● DATA语句,启动一个数据步,命名数据集 ● INPUT语句,描述如何读入每一条记录(观测) ● CARDS语句,提供要输入的数据 2. 将外部原始数据文件转换成SAS数据集 ● DATA语句,启动一个数据步,命名数据集 ● INFILE语句,指定存储有要读入数据的文件 ● INPUT语句,描述如何读入每一条记录 3. 利用已有的数据集创建新的SAS数据集 ● DATA语句,启动一个数据步,命名数据集 ● SET/MERGE/UPDATE语句,连接/合并/修改已有 的数据集 3.1.2 常用数据步语句简介 1. DATA语句 语句格式: DATA 数据集名表 ; DATA语句的作用是表明数据步的开始,并给出所建数据集的名称。 所有的数据集名都是由半角符号“.”分隔的两部分组成。第1部分称作1级名(libname或库逻辑名),它标识数据集所存贮的位置;第2部分(2级名)标识特定的数据集。 如:DATA A; 则建立名为 WORD.A 的数据集(临时)。 临时数据集:不指定1级名,使用WORK。 空数据集: 使用_NULL_数据集名,不建立数据集。 DATA _NULL_; A=SIN(3.1415/4); B=INT(A*100); PUT A B; RUN; 自动命名: 不给出数据集名,则SAS自动以DATA1,DATA2等依次命名 。 DATA ; 当前数据集: 最后建立的数据集 。 DATA D1; INPUT A B; CARDS; 3 5 7 9 ; RUN; DATA D2; INPUT C D; CARDS; 13 15 17 19 21 23 ; RUN; 2. INPUT语句 用来描述在输入记录中的数据,并把输入值赋给相应的变量。 语法:INPUT 变量列表 ; Input 语句中变量使用三种输入数据方式: 列表输入 列输入 格式化输入 (1)列表输入 在Input 语句中,变量只简单列出变量名 在数据中,数据由空格分隔。 字符数据默认长度为8,若读入长数据,需用length语句。 例:Input name $ age sex $ S1 S2 S3; 优点:简单易用。 缺点: 1)变量顺序必须与数据顺序一致。 2)不能有选择的读入数据,只能按顺序输入。 如:有A B C D E, 如只想输入A B D, 不能跳过C。 3)不能输入带有空格的数据。 注意:缺项值用“.”表示。 (2)列输入 在Input 语句中,变量名后指出变量值所处的列号。 在数据中,同一变量的数据应位于相同的列上。 例: Input name $ 1-8 count 10-12; cards; zhangsan 101 Lisi 102 优点: 1)输入值可以以任何顺序读入:INPUT FIR 73-80 SEC 10-12; 2)字符型数据中可包含空格 3)字符型数据可以最多到200个字符长 4)可读取全部或部分数值 :INPUT ID 10-15 GROUP 13; 缺点:数据必须严格按照列位置输入。 注意:所读取列中只有空格或“.”时,被作为缺项值。 (3)格式化输入 在Input 语句中,变量名后给出一个输入格式。 输入格式用来说明变量的数据类型和字段的宽度。 在数据中,数据一般要求列对齐。 例:INPUT NAME $10. H 4.2; 适合输入日期型数据: DATA DAYS; INPUT NUM $ BIRTHDAY MMDDYY8. TESTDAY DATE10. WT; CARDS; 1001 7-21-96 3MAR97 10 1002 10/30/96 14/JAN/97 4 1003 06 19 96 13JUN1997 9 1004 03 07 97 29 AUG 97 3 ; RUN; 注意: ●格式化读入时,读数据指针按给出的格式长度
文档评论(0)