[2018年最新整理]3变量分布特征的描述.ppt

  1. 1、本文档共109页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[2018年最新整理]3变量分布特征的描述

某车间50名工人日加工零件数分组表 按零件数分组 频数(人) 累积频数 105~110 110~115 115~120 120~125 125~130 130~135 135~140 3 5 8 14 10 6 4 3 8 16 30 40 46 50 合计 50 — 例:根据表中的数据,计算50名工人日加工零件数的众数 众数特点 1.众数不受分布数列的极大或极小值的影响. 2.当分组数列没有任何一组的次数占多数,而是近似于均匀分布时,则该次数分配数列无众数。若将无众数的分布数列重新分组或各组频数依序合并,又会使分配数列再现出明显的集中趋势。 3.如果与众数组相比邻的上下两组的次数相等,则众数组的组中值就是众数值;如果与众数组比邻的上一组的次数较多,而下一组的次数较少,则众数在众数组内会偏向该组下限;如果与众数组比邻的上一组的次数较少,而下一组的次数较多,则众数在众数组内会偏向该组上限。 4.缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不象数值平均数那样利用了全部数据信息。 (三)中位数、众数和算术平均数的关系 在对称分布(即正态)时 在右偏时 在左偏时 适度偏态时 众数与算术平均数的距离约为中位数与算术平均数距离的3倍 对称分布 右偏分布 左偏分布 一组工人的月收入众数为700元,月收入的算术平均数为1000元,则月收入的中位数近似值是: 例: 第二节 离中趋势的描述 一、离中趋势和离散指标 离中趋势,就是变量分布中各变量值背离中心值的倾向。如果说集中趋势是总体或变量分布同质性的体现,那么离中趋势就是总体或变量分布变异性的体现 。 离散指标就是反映变量值变动范围和差异程度的指标,即反映变量分布中各变量值远离中心值或代表值程度的指标,亦称为变异指标或标志变动度指标。 离散指标是衡量平均指标代表性的尺度。一般来讲,数据分布越分散,变异指标越大,平均指标的代表性越小;数据分布越集中,变异指标越小,平均指标的代表性越大。 常用的变异指标有:全距、平均差、方差和标准差、变异系数。 离散指标的作用 用离散指标衡量和比较平均指标的代表性。 用离散指标反映经济活动过程的均衡性、稳定性和节奏性。 离散指标为统计推断提供依据。 二、离散指标的测度 (一)全距(Range) 全距(R)也称为极差,是指总体各单位的两个极端标志值之差,即:    R=最大标志值-最小标志值 特点(优点与缺点) (1)简明;(2)只反映变异范围;(3)只受两个数值影响;最容易受极端值影响。没有反映中间数值的影响,没有反映分布情况。 例1:有两个学习小组的统计学开始成绩分别为: 第一组:60,70,80,90,100 第二组:78,79,80,81,82 很明显,两个小组的考试成绩平均分都是80分,但是哪一组的分数比较集中呢? 如果用全距指标来衡量,则有 R甲=100-60=40(分) R乙=82-78=4(分) 这说明第一组资料的标志变动度或离中趋势远大于第二组资料的标志变动度。 (二)四分位差 四分位差是四分位数中第一个四分位数与第三个四分位数之差,也称为内距或四分间距,通常用 表示,即: (三)异众比率 异众比率是分布数列中非众数组的频数与总频数之比,通常用 来表示,即: 在资料未分组的情况下, 平均差的计算公式为: 在资料已分组的情况下, 要用加权平均差公式: (四)平均差(Mean Deviation) 平均差是总体各单位标志值对其算术平均数的离差绝对值的算术平均数。 例2:某厂按月收入水平分组的组距数列如表所示,计算平均差 例1:以甲组学生数学成绩为例,平均差如下: A.D= 职工工资(元) 职工人数(f) 250-270 15 270-290 25 290-310 35 310-330 65 330-350 40 合计 180 组中值(x)   xf x- 260 3900 -50 750 280 7000 -30 750 300 10500 -10 350 320 20800 10 650 340 13600 30 1200 - 55800 - 3700 解:根据公式列表计算,得到 A.D= 由于平均差采用了离差的绝对值,不便于运算,这样使其应用受到了很大限制。 特点 (1)反映了全部标志值的变动情况; (2)受平均数水平高低、计量单位(不同性质的现象)影响; (3)取绝对值的方法消除离差正负号,不便于代数处理。 (五)方差(Variance)、 标准差(Standard Deviation) 方差和标准差是测度数据变异程度的最重要、最常用的指标。 方差是各个数据与其算术平均数的离差平方的平均数,通常以σ2

文档评论(0)

liwenhua00 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档