sas讲稿第1章.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS软件与应用统计 第一章 引 论 1.1 SAS与统计分析 1.1.1 什么是统计学? 统计学是研究如何收集数据、分析数据并进行推断的学科。 在一些发达国家,统计分析已经成为企业经营决策的一个重要组成部分。 统计学的应用必然要涉及数据的收集、存贮、整理,以及各种统计方法的实际计算,这些都要靠统计软件的帮助来完成。 1.1.2 什么是SAS系统? SAS系统 (Statistical Analysis System )是数据处理和统计领域的国际标准软件之一,是世界领先的数据分析和信息系统; 在众多的统计软件中,SAS系统以运行稳定、功能强大而著称。到2004年的20年中,SAS系统一直占据统计软件的高端市场,它被成功应用于120多个国家和地区的31,000多个机构中,直接用户超过3,500,000人。在世界财富500强中,有90%的公司使用SAS。而在财富500强的前100家企业中,更是有98%的公司使用SAS。目前SAS软件正在国内迅速地普及、发展。尽管SAS在国内的普及程度还远远不及美国和欧洲一些国家,但是相信随着加入WTO后对数据统计需求的增加,企业对数据统计分析将会越来越重视,会有越来越多的企业使用SAS系统。 在国际学术界有条不成文的规定,凡是用SAS统计分析的结果,在国际学术交流中可以不必说明算法,由此可见其权威性和信誉度。 在西方发达国家,SAS是大学生的必修课,也是其毕业后谋生的资本。在我国,SAS也逐渐成为统计师和文、理科大学生的“看家本领”。 作为SAS软件系统与应用统计的入门课程,本课程不强调全面介绍软件功能,而是让大家能够通过本课程掌握统计软件的基本用法,进一步掌握统计分析的基本方法,然后可以通过阅读更详细的资料以达到熟练使用统计软件完成统计应用的目的。 1.1.3 SAS系统如何实现统计分析? SAS系统的分析功能是散布在几乎所有的模块之中,较为集中的有:SAS/INSIGHT、SAS/STAT、SAS/QC、SAS/ETS等一些模块。 在SAS系统分析功能的使用上,除了提供编程调用外,SAS对一些常用的分析功能都提供了简便的菜单系统,使用户不用编程就可以享用SAS的许多深入的分析功能。 对于常用的一些统计分析方法,SAS系统中的如下三种方法可以达到同样的目的: ● SAS/INSIGHT(insight) ● 分析员应用(analyst) ● 直接编程 一般来说,SAS/INSIGHT最为直观,便于步步深入;分析员应用可提供自动形成的程序,而且在属性数据分析和功效函数计算方面较INSIGHT强;编程是功能最强的,尤其是一些特殊或深入的分析功能只能用编程实现,但相对来说,编程较难熟练掌握。本课程我们主要结合SAS/INSIGHT和分析员应用来介绍常用的一些统计分析方法。 1.2 SAS/INSIGHT SAS/INSIGHT是一个交互式的数据探索和分析的工具,用这一软件可以; ● 通过多窗口连动的图象和分析结果,对数据进行探索 ● 分析单变量分布 ● 用相关和主成分研究多变量间的关系 ● 用方差分析和回归分析说明、拟合变量间关系的模型 1.2.1什么是SAS数据集? SAS数据集(Data sets)是用来存放数据文件。应用SAS进行数据处理和数据分析时,所研究的数据必须存入数据集中。 例1.2.1-1认识一个数据集 C9501数据集的逻辑形式(二维表格) NAME SEX MATH CHINESE AVG 李明 男 92 98 86.8333 张红艺 女 89 106 88.6667 王思明 男 86 90 80.5000 张聪 男 98 109 94.4167 刘颍 女 80 110 85.8333 SAS数据集(Data sets)是一种关系型结构,包括描述部分和数据部分:描述部分包含了一些关于数据属性的信息;数据部分是由数据构成的矩形表。 在SAS数据集中,变量分为两种类型:字符型变量和数值型变量。 在SAS/INSIGHT中,为了区分变量在分析中的不同作用,变量又按其测量水平分为两类: (1) 区间型变量(interval variable):区间型变量必须是数值型变量,可以对其观测值进行各种四则运算,计算各种统计量; (2) 列名型变量(nominal variable):列名型变量可以是数值型的,也可以是字符型的,在SAS/INSIGHT中常起分类作用。 字符型变量只能是列名型的,对取值不多而用以区分不同类别的数值型变量也可看作列名型的。

文档评论(0)

fc86033 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档