第一讲数据的描述性分析.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一讲数据的描述性分析

数据分析 实验教案 朱宁编 2014.8.25 SAS系 统 简 介   SAS (Statistical Analysis System ) 系统是国际著名的数据分析软件系统。 该系统1966年开始研制,1976年由美国SAS公司实现商业化,1985年推出SAS/PC版本,1987年推出6.03版,目前已推出Windows 系统支持的8.2和9.0版,是目前国际上公认的著名的数据统计分析软件系统之一。 从1976年SAS开发成功至今,SAS的用户遍及119个国家,它已经成为同类产品中的领导者。在财富500强中,有90%的公司使用SAS。而在财富500强的前100家企业中,有98%的公司使用SAS。如此广泛的应用源于SAS系统的强大的分析功能、可组合的模块式软件系统和简单易学。 SAS系统是集数据分析、生成报表于一体的一种集成软件系统。它由基本部分和外加模块组成,其中基本部分包含的功能如下: –基本部分: BASE SAS 部分;–统计分析计算部分: SAS/STAT ; –绘图部分: SAS/GRAPH ;–矩阵运算部分: SAS/IML ; –运筹学和线性规划: SAS/OR ;–经济预测和时间序列分析: SAS/ETS ; 1.1.SAS的启动 1.2.SAS8.0 软件界面 SAS界面包括三个部分,即程序窗口、日志窗口和输出窗口。 EDITOR(程序窗口)编辑窗口用于编辑SAS源程序文件。编辑窗口支持全窗口编辑功能,即光标可以在整个窗口内随意移动,支持Windows系统常规编辑操作,如复制、剪切、粘贴等功能操作。SASV8提供了智能编辑功能,它可根据用户输入的SAS关键字、语句选项、变量名、数据、标记等不同内容显示不同的颜色,当用户输入的字串不正确时,对应颜色不对,警告使用者有错误发生。 LOG(日志窗口)运行记录窗口用于显示和记录SAS程序的运行情况,说明程序运行成功或存在错误,当程序出现错误时,LOG记录窗口中以红色字符显示错误信息,以绿色显示一些警告信息。提示使用者修改程序中的错误。 OUTPUT(输出窗口)分页显示SAS程序运行所产生的文本输出结果(图形输出通过GRAPHICS窗口显示)。对于文本结果的输出,可以使用主界面的菜单File|Save As将结果文档保存在磁盘中,保存的文件扩展名为.lst,但实际上是一种文本文件格式,可以使用文字处理软件,如Word或写字板、记事本等打开并进行编辑修改。对于输出到GRAPHICS窗口的图形,可以使用菜单File|Export as Image将图形导出保存在磁盘中,图形文件格式可以在“保存类型”下拉列表中选择。 1.3. SAS程序结构 SAS程序采用模块化结构,模块之间相互独立,每个模块完成一个任务。模块分为两种类型:一种类型是数据模块,数据模块以英文单词data作为开始语句。另一种类型是程序模块,程序模块以proc作为开始语句。模块中的语句之间用“;”分隔,同一个语句的不同项之间必须用一个以上的空格分隔。在一个程序中可以包含多个数据模块和程序模块,模块的位置是任意的。程序按照语句出现的先后顺序执行。 (1)SAS程序的语法 编写程序时必须遵循所使用的软件的语法规则,SAS程序的语法规则可以归纳为以下几条: ①标识符或数据之间至少用一个以上的空格分隔; ②每个语句用分号作为结束标志; ③变量名或其他名称最多包含8个字符,并且第一个字符为英文字母,名称中不能有空格,或SAS系统的保留符号,如:“-”、“.”、“,”、“…”、“$”等; ④SAS程序可以处理带有缺失数据的文件,数据缺失值用“.”表示; ⑤SAS程序只处理数值和字符串两种类型的变量,为了和数值变量相区别,输入语句中字符串变量名使用“$”作为后缀; ⑥程序中可以包含注释语句,注释语句以“/*”开始,以“*/”结束; ⑦除数据外,SAS程序不区分英文字母的大小写。 (2)SAS数据集 SAS的核心是SAS数据集是SAS文件的一种,一般又以下两部分组成: (1)描述部分 包含该数据集的一般信息,包括:数据集的名字及其成员类型、数据集建立的日期和时间、观测的数目以及数据集中每一个变量的特征信息,包括:Name(变量名)、Type(类型)、Length(长度)、Format(输出格式)、Informat(输入格式)、Label(标签)。 (2)数据部分 包含数据集中收集的数据的值,可以看作是一个矩形的表格。表格的列(columns)称为变量(variables),对应于原始数据文件或其他一些外部数据库所称的字段(fields);表格

文档评论(0)

kabudou + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档