第3章统计数据的描述度量.ppt

  1. 1、本文档共75页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章统计数据的描述度量第3章统计数据的描述度量

应用统计第1章 * 应用统计第1章 * * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * 应用统计第1章 * * Chebishev定理与经验法则 (1)Chebishev定理 对任何的一组数据, 观测值落于均值左右k个标准差的区间内的比例, 至少为 各种不同k值所对应的区间 k 区间 落在该区间内的比例 1 至少为0 2 至少为3/4 (75%) 3 至少为8/9 (89%) 4 至少为15/16 (94%) 例: 有一组关于顾客购物付账时等候时间的数据,已知等候时间的均值为4分钟,标准差为0.9分钟。 根据Chebishev定理, 当k=2时,至少有3/4或75%的观测值落在均值左右两个标准差的区间内,即[4±2×0.9] 区间内。即,等候时间介于2.2分钟至5.8分钟之间的顾客至少占75%。 (2)经验法则 当数据分布形状呈对称时, 有 (1 )约有68%的观测值落于 的区间内; (2 )约有95%的观测值落于 的区间内; (3 )约有97%的观测值落于 的区间内。 上例中顾客等候付账的时间是对称分配, 则有95%的顾客需等候2.2~5.8分钟。 * 5.变异系数 (Coefficient of Variance) 比较不同总体的离散程度时,若使用的度量单位不同,或它们在数量级上相差很大,则用绝对数值表示的方差和标准差缺乏可比性,此时就应使用相对变异指标(变异系数)。 例如,对汽车发动机的汽缸而言,0.05毫米的标准差就很大了,但对建筑工程而言则可完全忽略不记。 相对变异指标中最重要的是标准差系数(又称为变异系数或离散系数),是标准差与均值之比,记为V? 。 * 6.Z值 Z值等于数据与均值的差再除以标准差。Z值有助于定义极端值。Z值越大,数据远离均值的距离越大。其计算公式如下: 通常,Z值小于–3.0或大于+3.0时,认为数据中含有极端值。 * 具有相同平均值和方差的数据,其分布形状就一样吗? §3.3 度量偏斜程度与峰度的指标 数 值 1 2 3 4 5 6 7 8 9 第一组的次数 1 2 0 2 3 0 4 0 1 第二组的次数 1 0 4 0 3 2 0 2 1 假设有两组数据资料如下, 其均值都是5 , 标准差都是2.287。 * 一、偏度(Skewness) 总体分布的特征不仅与均值和变异指标有关,而且与分布的偏斜程度有关,如对称分布、右偏分布和左偏分布。这种分布形态上的数量特征,往往具有重要的社会经济意义。偏度系数是度量偏斜程度的指标,主要有如下计算方法: (1)Pearson偏度系数 该偏度系数记为Sk,计算公式为 Sk是无量纲的量,取值通常在-3~+3之间,其绝对值越大,表明偏斜程度越大。 * Sk1,因均值在众数左侧,是一种左偏分布,又因偏态系数为负,故又称负偏; Sk2,因均值在众数右侧,是一种右偏分布,又因偏态系数为正,故又称正偏; 数 值 1 2 3 4 5 6 7 8 9 第一组的次数 1 2 0 2 3 0 4 0 1 第二组的次数 1 0 4 0 3 2 0 2 1 该偏度系数是用三阶中心矩除以标准差的三次方来度量偏斜程度,记为?,计算公式为 m3称为三阶中心矩。 偏度系数?可以适用任何数据。?和SK的计算方法 不同,因此根据同一组数据计算的结果也不相同。 * (2)使用三阶

文档评论(0)

cxiongxchunj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档