管理统计学 第3章 数据分布特征的描述.ppt

管理统计学 第3章 数据分布特征的描述.ppt

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
管理统计学 第3章 数据分布特征的描述

管理统计学 第三章 第三章 数据分布特征的描述 第一节 统计变量集中趋势的测定 第二节 统计变量离散程度的测定 第三节 变量分布的偏度与峰度 第一节 统计变量集中趋势的测定 一、测定集中趋势的指标及其作用 二、数值平均数 三、众数与中位数 一、测定集中趋势的指标及其作用 集中趋势(Central tendency) 较大和较小的观测值出现的频率比较低,大多数观测值密集分布在中心附近,使得全部数据呈现出向中心聚集或靠拢的态势。 测定集中趋势指标的作用 1.反映变量分布的集中趋势和一般水平。 如用平均工资了解职工工资分布的中心,反映职工工资的一般水平。 2.可用来比较同一现象在不同空间或不同阶段的发展水平。 不受总体规模大小的影响, 在一定程度上使偶然因素的影响相互抵消。 3.可用来分析现象之间的依存关系。 如研究劳动者的文化程度与收入的关系 4.平均指标也是统计推断中的一个重要统计量,是进行统计推断的基础。 二、数值平均数 (一)算术平均数(均值) 一组数据的总和除以这组数据的项数所得的结果; 最常用的数值平均数。 1.简单算术平均数 把每项数据直接加总后除以它们的项数。 通常用于对未分组的数据计算算术平均数。 计算公式: 例 3-1 分组数据不能简单平均 !因为各组变量值的次数不等! 2.加权算术平均数 加权算术平均数的计算公式: 权数(fi ,也称权重) 权数——指在计算总体平均数或综合水平的过程中对各个数据起着权衡轻重作用的变量。 可以是绝对数形式,也可以是比重形式(如频率)来表示。 事实上比重权数更能够直接表明权数的权衡轻重作用的实质。 当权数完全相等(f1 =f2 =…= fn)时,加权算术平均数就成了简单算术平均数。 3.由组距数列计算算术平均数 要点: 各组变量值用组中值来代表。 假定条件是各组内数据呈均匀分布或对称分布。 计算结果是近似值 . 4.对相对数求算术平均数 由于各个相对数的对比基础不同,采用简单算术平均通常不合理,需要加权。 5.算术平均数的主要数学性质 (1)算术平均数与变量值个数的乘积等于各个变量值的总和。 (二)调和平均数(Harmonic mean) 调和平均数也称为倒数平均数。 各变量值的倒数(1/xi)的算术平均数的倒数. 其计算公式为: (续) 社会经济统计中所应用的调和平均数通常是加权算术平均数的变形, 已知各组变量值 xi 和(xi fi)而缺乏 fi 时,加权算术平均数通常可变形为调和平均数形式来计算。 【例3-4】解: (三)几何平均数(Geometric mean) 几何平均数— n个变量值连乘积的n次方根。 简单几何平均数 【例3-5】 某企业产品的加工要顺次经过前后衔接的五道工序。本月该企业各加工工序的合格率分别为88%、85%、90%、92%、96%,试求这五道工序的平均合格率。 解:本例中各工序的合格率具有环比的性质,企业产品的总合格率等于各工序合格率之连乘积。所以,所求的平均合格率应为: 三、众数与中位数 (一)众数(Mode) 众数是一组数据中出现频数最多、频率最高的变量值,常用 M0 表示。 如表3-2中年龄的众数值MO=25。 众数代表的是最常见、最普遍的状况,是对现象集中趋势的度量。 可用来测度定性变量的集中趋势; 销售量最大的产品颜色是“白色”,则有M0=“白色” 可以度量定量变量的集中趋势。 从分布曲线的角度看,众数就是变量分布曲线的最高峰所对应的变量值。 组距数列中众数的确定 先找到众数组。 在等距数列中,众数组就是次数最多的组; 在异距数列中,众数组应是频数密度最大的组。 根据众数组与其相邻两组的次数差来推算。 其近似公式为: (二)中位数(Median) 中位数是将数据由小到大排列后位置居中的数值。 由组距数据计算中位数 先确定中位数组,即中间位置(用Σf/2来计算)所在的组。 假定中位数组内次数均匀分布(次数与变量值的区间大小成比例),近似推算中位数的值。 计算公式为: 四分位数、十分位数和百分位数 四分位数是将数据由小到大排序后,位于全部数据1/4位置上的数值。 十分位数是将数据由小到大排序后,位于全部数据1/10位置上的数值。 百分位数是将数据由小到大排序后,位于全部数据1/100位置上的数值。 中位数也就是第二个四分位数、第五个十分位数、第五十个百分位数。 分位数与其它指标结合,可以更详细地反映数据的分布特征。 箱线图(boxplot) 箱线图由一组数据的最小值(xmin)、第一四分位数(Q1)、中位数(Me)、第三四分位数(Q3)、最大值(xmax)等五个数值来绘成。 利用箱线图可以观察数据分布的范围、中心位置和对称性等特征,还可以进行多组数据分布的比较。 (三)众数、中位数和算术平均数的比较 1.算术平

文档评论(0)

sandaolingcrh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档