- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
描述统计量 统计图形 第3章 描述性统计描述性统计是最基本的统计分析,通过对原始数据进行总括和描述来说明总体的情况和特征。描述性统计一方面利用一系列数字指标来概括数据的信息,另一方面利用直观简单的图形来展现数据的特性。描述统计量包括:表示位置的统计量、表示分散程度的统计量和表示分布形态的统计量。 一、描述统计量表示位置的统计量用来描述数据的平均位置或集中位置,是数据的最基本指标。 (1)均值(Mean):由样本的总和除以样本的个数 ,也被称为(算术)平均数,用来描述数据的平均位置。 (2)中位数(Median):将样本按照大小顺序排列之后,处于中间位置的样本值,用来描述数据的平均位置,它不受个别异常值的影响,相比均值来说稳健性较好。 (3)众数(Mode):样本中出现频率最大的样本值,用来描述数据的集中位置。 (4)百分位数(Percentile):将样本按照从小到大排列后,处于p%位置的样本值被称为第p百分位数,表示有p%的样本值小于它。几个特殊的百分数为:最小值、最大值、 中位数、四分之一分位数Q1、四分之三分位数Q3。 1、表示位置的统计量 一、描述统计量表示分散程度的统计量用来描述数据分散程度的大小。 (1)方差(Variance):各样本值与均值差值平方的平均值,反映数据离散程度的最基本指标,方差越小,则表明数据越集中于均值附近,方差越大,则数据离均值越远。 (2)标准差(Standard Deviation):方差的平方根,与方差相比,标准差的度量单位与原始数据相同,更能准确地反映数据的分散程度。 (3)标准误(Standard Error of Mean):样本均值的标准误差。 (4)变异系数(Coefficient of Variation):将标准差表示为均值的百分数,是无量纲的,方便于比较不同单位下数据的分散性。 (5)极差(Range):样本中最大值与最小值之差。 (6) 校正平方和(Corrected Sum of Squares):样本值与均值偏差的平方和。 (7)未校正平方和(Uncorrected Sum of Squares):样本值的平方和。 2、表示分散程度的统计量 一、描述统计量表示分布形态的统计量用来描述数据分布的整个形态特征。 (1)偏度(Skewness):衡量数据分布对称性的指标。当数据关于均值对称分布时,偏度为0;当数据向右偏,即右边的数据更为分散时,偏度大于0;当数据向左偏,即左边的数据更为分散时,偏度小于0。 (2)峰度(Kurtosis):衡量数据分布尖峭程度的指标。当数据分布为标准正态分布时,峰度等于0;当数据分布比标准正态分布更尖峭,或者说尾部更扁平(称为轻尾)时,峰度大于0;当数据分布比标准正态分布更平缓,或者说尾部更厚重(称为厚尾)时,峰度小于0。 3、表示分布形态的统计量 一、描述统计量MEANS过程的主要功能是计算基本的描述统计量,此外还可以进行一些参数估计和假设检验。语句格式为: PROC MEANS DATA=数据集名 选项列表 统计量关键字列表;VAR 变量名列表;BY 分组变量名;CLASS分组变量名; RUN;其中,只有PROC语句是必须的,其他语句可以根据用户需要进行选用。 4、SAS计算描述统计量 一、描述统计量 语句说明: (1)PROC语句规定开始运行MEANS过程,并指定要分析的数据集名。可带的选项有: FW:规定打印统计量的宽度 MAXDEC=:规定输出统计量的小数位数 VARDEF=选项:规定计算方差时用的除数,选项DF表示使用自由度N-1(此为默认值),选项N表示使用观测个数N,选项WGT表示使用权数和MEANS过程默认输出的统计量有:观测总数、均值、标准差、最大值和最小值。如果要计算其他统计量或其中的某一些统计量,则可在PROC语句中指定统计量的关键字。 4、SAS计算描述统计量 一、描述统计量 PROC语句中的统计量关键字 关键字 统计量 关键字 统计量 N 有效观测数 MAX 最大值 NMISS 缺失值个数 MIN 最小值 MEAN 均值 RANGE 极差 VAR 方差 MEDIAN 中位数 STDDEV | STD 标准差 Q1 四分之一分位数 STDERR 标准误 Q3 四分之三分位数 CV 变异系数 QRANGE 四分位数间距 SUM 总和 P1 第1百分位数 SUMWGT 加权值总和 P5 第5百分位数 CSS 校正平方和 P10 第10百分位数 USS 未校正平方和 P90 第90百分位数 SKEWNESS 偏度 P95 第95百分位数 KURTOSIS 峰度 P99 第99百分位数 4、SAS计算描述统计量 一、描述统计量 语句说明: (2)VAR语句规定要计算描
您可能关注的文档
最近下载
- 合作协议书(15篇)(模板) .pdf VIP
- 《电动汽车充电站设计规范》GB50966-2014(完整).docx VIP
- 网御星云网闸技术宝典.pdf VIP
- 江淮CPC(D)20-30-CPC(D)30A叉车零件图册.pdf VIP
- DB32T 3610.2-2025 道路运输车辆智能监控系统技术规范 第2部分:终端及测试方法.docx VIP
- 驾驶员的夜间行车视觉与夜间驾驶技巧.pptx VIP
- 中医临床三基(医师)临床基本知识针灸推拿考试真题.docx VIP
- GB50156-2012(2014年版) 汽车加油加气站设计与施工规范.pdf VIP
- 临近既有地铁的异形深基坑支护设计与施工.pdf VIP
- 《葡萄沟》精品课件.pptx VIP
文档评论(0)