数据的描述性分析.pptVIP

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
四分位数(quartiles) 1.集中趋势的测度值之一。 2.将所有数据排序后处于25%、50%和75%位置上的值。 四分位数位置的确定 未分组定距数据的四分位数 未分组定距数据的四分位数 §4.3 分布的形状 偏态 (概念要点) 1. 数据分布偏斜程度的测度 2. 偏斜系数=0为对称分布 3. 偏斜系数 0为右偏分布 4. 偏斜系数 0为左偏分布 5. 计算公式为 偏态系数 (计算过程) 偏态系数 (计算结果) 峰度 (概念要点) 1. 数据分布扁平程度的测度 2. 峰度系数=0扁平程度适中 3. 峰度系数0为扁平分布 4. 峰度系数0为尖峰分布 5. 计算公式为 R=Xmax-Xmin 极差(Range) ——从变动范围测度总体数据的离散程度 数列中最高组的上限与最低组的下限的差。——偏大 数列中最高组的组中值与最低组的组中值的差。——偏小 数列中最高组的组中值与最低组的下限的差。 数列中最高组的上限与最低组的组中值的差。——比较接近 特点 : 组距数列的全距计算方法: 计算简单,容易理解。 过于粗略。 受极端值影响大。 数据利用率低,信息丧失严重。 受抽样变动影响大。 1. 离散趋势的测度值之一 2. 也称内距或四分间距 3. 第三四分位数与第一四分位数之差 Qr = Q3 – Q1 4. 反映了中间50%数据的离散程度 5.不受极端值的影响 6.可用于衡量中位数的代表性 四分位差 (interquartile range) 平均差(Mean deviation)MD 已分组资料 未分组资料 优点:包含了总体中各个变量值的差异 缺点:不适于代数运算 标准差(Standard deviation)σ 未分组资料 已分组资料 方差(Variance) σ2 30 --- --- 10 --- 合计 0 0 6 4 2 8 4 -2 4 1 1 7 1 1 7 0 0 6 16 4 10 1 -1 5 9 -3 3 4 -2 4 中环数 中环数 乙 甲 164 合计 8 110以上 14 100~110 27 90~100 36 80~90 50 70~80 19 60~70 10 60以下 工人数 日产量(Kg) 例:某车间工人日产量资料如下表所示,要求日产量的标准差。 日产量(㎏) 工人数 组中值x 60以下 10 55 -27.62 7628.6440 60~70 19 65 -17.62 5898.8236 70~80 50 75 -7.62 2903.2200 80~90 36 85 2.38 203.9184 90~100 27 95 12.38 4138.1388 100~110 14 105 22.38 7012.1016 110以上 8 115 32.38 8387.7152 合 计 164 — — 36172.5616 是非标志的标准差 成数: 具有某种表现或不具有某种表现的单位数占所有单位数的比重称为成数。 1 n --- 合计 q n0 0 否 p n1 1 是 频率 次数 标志值 品质标志 是非标志的平均数: 是非标志的标准差: 交替标志的标准差即被研究标志的成数p与q乘积的平方根。 离散系数(Coefficient of variation) 应用: 比较具有不同计量单位的资料的差异程度. 比较计量单位相同而均值不相同的资料的差异程度; 例:对成年人身高之间的差异和幼儿身高之间的差异状况进行抽样调查,得10名成年人和10名幼儿身高(㎝)资料如下。要求比较哪组身高差异大。 成年组:166 169 172 177 180 170 172 174 168 173 幼儿组: 68 69 68 70 71 73 72 73 74 75 69 182 10 80 177 9 76 174 8 70 174 7 68 173 6 71 172 5 70 169 4 69 168 3 64 167 2 63 164 1 体重(Kg) 身高(cm) 序号 设有10人的身高、体重资料如下表,试比较身高与体重的差异程度。 扁平分布 尖峰分布 偏态 峰度 左偏分布 右偏分布 与标准正态分布比较! 【例】已知某年我国农村居民家庭按纯收入分组的有关数据如表。试计算偏斜系数。 2.28 12.45 20.35 19.52 14.93 10.35 6.56 4.13 2.68 1.81 4.94 500以下 500~1000 1000~15

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档