- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS统计分-析从入门到精通
第一章 数据预处理;统计学原理中数据预处理的内容:
数据预处理是在对数据分类或分组之前所做的必要处理,内容包括:数据的审核、数据的筛选、
数据的排序、数据透视表等内容。
;1.SAS编程基础
1.1.SAS编程语言的基本结构
在SAS中可以利用“Editor”或“Program Editor”窗口书写程序
SAS语言结构比较简单,主要由DATA step和
PROC step 组成。
程序的每一行以“;”表示结束。一些全局变量的设置语句应放在DATA步之前。;其基本命令有:
title“…”;
libname …;
data…;
run;
proc…;
run;
基本运算符号:
= ≤ ≥ ≠
Eq lt gt le ge ne;DATA步(数据步)
是SAS进行数据管理和操作的基本步骤,其主要功能包括:建立SAS数据集,导入外部数据文件,分割、修改、合并、更新现有的SAS数据集,分析、呈现和管理数据,利用数据集中已有数据计算或生成新的变量
主要命令有:
infile语句:从外部文件获取数据
input语句:为读入的数据指定变量名及格式
cards语句:用于在SAS系统中直接输入数据;PROC步(过程步)
主要进行相应的数据处理和分析活动
主要命令有:
data 语句表示该PROC步所处理的数据集
var 语句表示处理该数据集中的特定变量
Where语句表示指定系统处理符合一定条件或表达式的眼本
By语句表示指定系统按照所列示的变量进行分组处理,使用该语句时,必须先对该语句中指定的变量进行排序
;此外,常见的PROC过程还有:
PRINT 显示数据集的变量名及变量值
SORT 对指定变量进行排序
MEANS 对数值型变量进行描述统计分析
UNIVARIATE 对数值型变量进行描述统计分析
FREQ 对定序变量进行描述统计分析
CHART 对指定变量绘制文本形式的图形
GCHART 在“Graph”窗口中对指定变量绘制图形;1.2.SAS结构化编程语言
SAS结构化编程语句主要有顺序语句、条件语句和循环语句。这三种基本形式的语句均可在DATA不和PROC步中使用。
条件语句
例1.比较X和Y两个变量的大小。如果XY,则输出
“XY”;如果XY,则输出“XY”;如果X=Y,
则输出“X=Y”。假定X=10,Y=20。;循环语句:计数循环、当循环、直到循环
???数循环:
data;
do x= to by;
end;
Put“y=” y;
run;
例:计算1~100之内的所有的奇数自然数之和
;
当循环:
data;
do while( 限定条件)
end;
put“y=” y;
run;
例:计算1~100之内的所有的奇数自然数之和。
直到循环:
do until(限定条件)
例:计算1~100之内的所有的奇数自然数之和。
例:在1~100以内计算50以内的奇数自然数之和。
;2.SAS的数据处理对象
2.1.SAS数据库和SAS数据集
SAS数据库
SAS数据库具体是指存放SAS数据文件的文件夹,它与计算机中某个具体的文件夹相对应。
SAS数据库的分类:
临时库:只有一个,名为Work。每次启动SAS时自动生成,关闭SAS时自动被清除。
永久库:可以有多个。用户可以自己指定永久库的库标记。
每次启动SAS,有三个数据库是不可少的:
SASUSER SASHELP WORK; SAS永久数据库的建立
通过工具栏建立:
通过菜单方式建立:
资源管理器/逻辑库/文件选项中的新建
通过命令的方式建立:dmlibassign
通过编程的方式建立:Libname
例:建立一个名为“test”的永久数据库,该数据库对应的文件夹所在的位置为“D:\Statistics\sas\sas9.2”
Libname test “D:\Statistics\sas\sas9.2”;SAS数据集
与SAS数据库类似,SAS数据集也可以分为临时数据集和永久数据集。可以是不超过8个字符的字符串,但第一个字符必须是字母。
每一个数据集都有一个二级名字。第一级是库标记,第二级是数据集名,中间用“.”格开。
调用永久数据库中数据集时,应当指定该数据集对应的库标记,而调用临时数据库的数据集时,则可以省略库标记,直接引用即可。
;2.2.SAS数据集的建立
SAS变量的基本类型:数值型、字符型。
默认长度为8字节,对于实际数据中遇到的缺失值,SAS系统通常用“.”表示。
通过菜
您可能关注的文档
最近下载
- 地铁物业管理培训课件.pptx
- 工程数学(本)形成性考核作业4.doc
- GB T 34520.7-2017 连续碳化硅纤维测试方法 第7部分:高温强度保留率 标准.pdf
- 自编教材审核表(模板).pdf
- 一例慢性阻塞性肺疾病急性加重期合并II型呼吸衰竭患者的个案护理PPT.pptx
- [大庆]黑龙江大庆市民政局所属事业单位选调事业编制工作人员笔试上岸试题历年高频考点难、易错点附带答案详解.docx VIP
- ISO9001 14001 ISO45001检查表审核方法全套.docx VIP
- 增光膜规格说明书.pdf
- 人教版数学四年级第一单元教材解读及集体备课课件.pptx VIP
- 2024 离婚协议书 离婚协议(打印版).docx
文档评论(0)