SAS统计分-析从入门到精通.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS统计分-析从入门到精通

第一章 数据预处理;统计学原理中数据预处理的内容: 数据预处理是在对数据分类或分组之前所做的必要处理,内容包括:数据的审核、数据的筛选、 数据的排序、数据透视表等内容。 ;1.SAS编程基础 1.1.SAS编程语言的基本结构 在SAS中可以利用“Editor”或“Program Editor”窗口书写程序 SAS语言结构比较简单,主要由DATA step和 PROC step 组成。 程序的每一行以“;”表示结束。一些全局变量的设置语句应放在DATA步之前。;其基本命令有: title“…”; libname …; data…; run; proc…; run; 基本运算符号: = ≤ ≥ ≠ Eq lt gt le ge ne;DATA步(数据步) 是SAS进行数据管理和操作的基本步骤,其主要功能包括:建立SAS数据集,导入外部数据文件,分割、修改、合并、更新现有的SAS数据集,分析、呈现和管理数据,利用数据集中已有数据计算或生成新的变量 主要命令有: infile语句:从外部文件获取数据 input语句:为读入的数据指定变量名及格式 cards语句:用于在SAS系统中直接输入数据;PROC步(过程步) 主要进行相应的数据处理和分析活动 主要命令有: data 语句表示该PROC步所处理的数据集 var 语句表示处理该数据集中的特定变量 Where语句表示指定系统处理符合一定条件或表达式的眼本 By语句表示指定系统按照所列示的变量进行分组处理,使用该语句时,必须先对该语句中指定的变量进行排序 ;此外,常见的PROC过程还有: PRINT 显示数据集的变量名及变量值 SORT 对指定变量进行排序 MEANS 对数值型变量进行描述统计分析 UNIVARIATE 对数值型变量进行描述统计分析 FREQ 对定序变量进行描述统计分析 CHART 对指定变量绘制文本形式的图形 GCHART 在“Graph”窗口中对指定变量绘制图形;1.2.SAS结构化编程语言 SAS结构化编程语句主要有顺序语句、条件语句和循环语句。这三种基本形式的语句均可在DATA不和PROC步中使用。 条件语句 例1.比较X和Y两个变量的大小。如果XY,则输出 “XY”;如果XY,则输出“XY”;如果X=Y, 则输出“X=Y”。假定X=10,Y=20。;循环语句:计数循环、当循环、直到循环 ???数循环: data; do x= to by; end; Put“y=” y; run; 例:计算1~100之内的所有的奇数自然数之和 ; 当循环: data; do while( 限定条件) end; put“y=” y; run; 例:计算1~100之内的所有的奇数自然数之和。 直到循环: do until(限定条件) 例:计算1~100之内的所有的奇数自然数之和。 例:在1~100以内计算50以内的奇数自然数之和。 ;2.SAS的数据处理对象 2.1.SAS数据库和SAS数据集 SAS数据库 SAS数据库具体是指存放SAS数据文件的文件夹,它与计算机中某个具体的文件夹相对应。 SAS数据库的分类: 临时库:只有一个,名为Work。每次启动SAS时自动生成,关闭SAS时自动被清除。 永久库:可以有多个。用户可以自己指定永久库的库标记。 每次启动SAS,有三个数据库是不可少的: SASUSER SASHELP WORK; SAS永久数据库的建立 通过工具栏建立: 通过菜单方式建立: 资源管理器/逻辑库/文件选项中的新建 通过命令的方式建立:dmlibassign 通过编程的方式建立:Libname 例:建立一个名为“test”的永久数据库,该数据库对应的文件夹所在的位置为“D:\Statistics\sas\sas9.2” Libname test “D:\Statistics\sas\sas9.2”;SAS数据集 与SAS数据库类似,SAS数据集也可以分为临时数据集和永久数据集。可以是不超过8个字符的字符串,但第一个字符必须是字母。 每一个数据集都有一个二级名字。第一级是库标记,第二级是数据集名,中间用“.”格开。 调用永久数据库中数据集时,应当指定该数据集对应的库标记,而调用临时数据库的数据集时,则可以省略库标记,直接引用即可。 ;2.2.SAS数据集的建立 SAS变量的基本类型:数值型、字符型。 默认长度为8字节,对于实际数据中遇到的缺失值,SAS系统通常用“.”表示。 通过菜

文档评论(0)

xxj1658888 + 关注
实名认证
内容提供者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2024年04月12日上传了教师资格证

1亿VIP精品文档

相关文档