SAS统计应用基础第三讲共讲.ppt

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS统计应用基础第三讲共讲

第三章 数据管理入门 3.1 SAS数据集的基本格式 3.1.1 数据集的基本结构 一个SAS数据集就是一个数据文件,用来存放相应的变量设置和具体变量值,是一个标准的关系型数据库中的二维表格。 ①表格中的每一行就是一条记录,也称为观测 (observation) ②表格中每一列代表一个变量(variable)数据库术语中 的字段 注意:在SAS中观测数和变量数没有限制。 描述部分(descriptor portion):存放变量的定义。包括数据集的名 称、建立数据集的日期和时间、变 量和观测的个数、各变量的具体属 性及其他信息,如密码等 数据部分(data portion):存放具体数值。按照描述部分对变量 的定义,依次将数据排列为相应的格式。 数据集 3.1.2 数据集的描述部分 1.数据集名称 在遵循相应操作系统的文件名规则的前提下,有如下规定: ①必须由英文字母或下划线开始 ②名称中可包含数字、字母和下划线 ③长度可以是1-32个字符 对各类不同对象的命名均适用。如:逻辑库名、数据集名、数组名、宏名等 SAS 7.0版以后 长度可以是1-8个字符 SAS 6.12版以前 2.变量名与变量标签 变量名不能使用中文,如果需要使用中文对变量加以进一步说明,则可以使用变量标签(label)。每个变量可以有一个标签,用于对变量的具体含义作进一步的说明,长度限制在256个字符内。 3.变量的类型与长度 字符型:其值可取任意字符。 数值型:其值只能取数值。 时间型 日期型 实际上按照数值型变量的格式存储 变量 例如,日期型数值存储的都是从1960年1月1日到该日期的天数。 变量长度 数值型变量:SAS默认长度8位。8位的浮点存储方式对 大多数应用已经足够。 字符型变量:SAS默认长度8位。不够用,可以对量 的设定加以更改,最大长度可达32K。 3.1.3 数据集的数据部分 没有太多特殊的地方。需要强调的是对缺失值的处理 对于数值型变量,缺失值用小数点表示。 对于字符型变量,缺失值用空字符表示。 分为直接输入方式和外部文件读入方式 3.2 数据集的建立 3.2.1直接输入方式建立数据集 Data case 2_2; Input x y@@; Cards; 34 56 78 90 35 67 89 10 23 65 77 45 ; Data case 2_2; Input x y; Cards; 34 56 78 90 35 67 89 10 23 65 77 45 ; 比较这两段程序,理解@@的含义 对于字符型变量,只需要在变量名后加上“$”表明其为字符型即可,如下面的数据步: Data case2_3; Input x y $ @@; Cards; 1 ‘234’ 5 678 9 abc 10 “def” ; 注意:对于字符型变量,在数据块中不需要加入单或双引号,否则会被当作字符串的一部分读入。 对于超过默认8位长度的字符,如果对相应变量不加长度定义,则系统会在读入时只读入前8位,而将后面的字符截掉。因此,可以用length语句定义变量的长度。Length语句一般应出现在变量定义之前,其格式为: Length 变量名 $ 长度 Data case2_3; Length y $ 20; Input x y $ @@; Cards; 1 ‘234’ 5 678 9 abc 10 “def12334556678” ; 注:去掉length语句后看运行结果。 3.2.2 外部文件读入方式建立数据集 事先建立纯文本文件case2_2.txt,内容为: 34 56 78 90 35 67 89 10 23 65 77 45 程序如下: Data case2_2; Infile ‘c:\case2_2.txt’; Input x y @@; Run; 当数据量较大时,采用外部文件读入方式可以避免在程序中输入非常大的数据块,更有利于程序的阅读。 1、数据的格式化读入 3.2.3 更灵活地建立数据集 FORMAT variables format DEFAULT-default; Variables 为希望指定输出格

文档评论(0)

jiqingyong14 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档