第3章SAS描述性统计.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 描述性统计 描述统计量 统计图形 一、描述统计量 描述性统计是最基本的统计分析,通过对原始数据进行总括和描述来说明总体的情况和特征。描述性统计一方面利用一系列数字指标来概括数据的信息,另一方面利用直观简单的图形来展现数据的特性。 描述统计量包括:表示位置的统计量、表示分散程度的统计量和表示分布形态的统计量。 1、基本概念 一、描述统计量 (1)表示位置的统计量 均值:由样本的总和除以样本的个数 ,即 中位数:将样本按照大小顺序排列之后,处于中间位置的样本值 众数:样本中出现频率最大的样本值 百分位数:将样本按照从小到大排列后,处于p%位置的样本值被称为第p百分位数 1、基本概念 一、描述统计量 (2)表示分散程度的统计量 方差 :各样本值与均值差值平方的平均值,即 标准差 :方差的平方根,即 标准误 :样本均值的标准误差,定义为 变异系数 :是将标准差表示为均值的百分数,即 极差:样本中最大值与最小值之差 1、基本概念 一、描述统计量 (3)表示分布形态的统计量 偏度 :是衡量数据分布对称性的指标,定义为 当数据关于均值对称分布时,偏度为0;当数据向右偏时,偏度大于0;当数据向左偏时,偏度小于0。 峰度:是衡量数据分布尖峭程度的指标,定义为 当数据分布为标准正态分布时,峰度等于0;当数据分布比标准正态分布更尖峭时,峰度大于0;当数据分布比标准正态分布更平缓时,峰度小于0。 2、MEANS过程 一、描述统计量 MEANS过程的主要功能是计算基本的描述统计量,此外还可以进行一些参数估计和假设检验。MEANS过程的语句格式为: PROC MEANS DATA=数据集名 选项列表 统计量关键字列表; VAR 变量名列表; BY 分组变量名; CLASS分组变量名; RUN; 其中,只有PROC语句是必须的,其他语句可以根据用户需要进行选用。 2、MEANS过程 一、描述统计量 语句说明: (1)PROC语句规定开始运行MEANS过程,并指定要分析的数据集名。 MEAR过程默认输出的统计量有:观测总数、均值、标准差、最大值和最小值。如果要计算其他统计量或其中的某一些统计量,则可在PROC语句中指定统计量的关键字。 (2)VAR语句规定要计算描述统计量的数值型变量及其顺序。若不使用此语句,则默认对所有的数值型变量进行计算。 (3)BY语句规定了分组变量,要求在BY分组内计算描述性统计量。 (4)CLASS语句规定了观测分组,要求在观测分组内计算描述性统计量。CLASS语句与BY语句的功能类似,但是CLASS语句不要求数据集事先按照变量进行排序,而且两个语句在输出格式上也有一些区别。 2、MEANS过程 一、描述统计量 PROC语句中的统计量关键字 第99百分位数 P99 峰度 KURTOSIS 第95百分位数 P95 偏度 SKEWNESS 第90百分位数 P90 未校正平方和 USS 第10百分位数 P10 校正平方和 CSS 第5百分位数 P5 加权值总和 SUMWGT 第1百分位数 P1 总和 SUM 四分位数间距 QRANGE 变异系数 CV 四分之三分位数 Q3 标准误 STDERR 四分之一分位数 Q1 标准差 STDDEV | STD 中位数 MEDIAN 方差 VAR 极差 RANGE 均值 MEAN 最小值 MIN 缺失值个数 NMISS 最大值 MAX 有效观测数 N 统计量 关键字 统计量 关键字 3、UNIVARIATE过程 一、描述统计量 UNIVARIATE过程也可以提供描述统计量的计算,另外还有统计频数、绘制图形和假设检验的功能。UNIVARIATE过程的语句格式为: PROC UNIVARIATE DATA=数据集名 选项列表; VAR 变量名列表; BY 分组变量名; CLASS分组变量名; RUN; 使用UNIVARIATE过程计算描述统计量与MEANS过程所用的语句和选项都基本类似,只是UNIVARIATE过程不需要指定统计量关键字,而是默认给出所有的基本统计量和一些关于位置检验的结果。 1、条形图和饼图 二、统计图形 条形图和饼图是常见的展现属性数

文档评论(0)

小教资源库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档