数值描述度量.ppt

  1. 1、本文档共147页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数值描述度量

第三章 数值描述度量 引 言 在描述统计分析中,第二章中我们学习的如何用表和图的形式来演示、汇总和整理数据是其很重要的组成部分,但这不是描述统计分析的全部,本章我们将继续讲解描述统计分析中的另外一部分:描述性统计的数值方法(主要涉及数值型数据) 。它们提供了汇总和描述数据的其他可选方法。虽然数据通过图表演示和汇总后,已经可以反映出被研究对象的一些状态和特征,已经能够可以得到若干规律性认识,但总体而言这些认识还比较肤浅,精确度也不够。为此,我们还要使用各类代表性的数量特征值来准确地描述这些数据。获取更深入的认识。 引 言 对单变量数据的特征描述,主要有以下几个方面:集中趋势、离散程度、数据分布形状等的度量。对双变量数据而言,主要是对其相关程度的度量。 同时,如果使用样本中的数据来计算度量值,则称这样的度量值为样本统计量(sample statistics);如果用总体中的数据来计算,则称为总体参数(population parameters)。 本章主要内容及学习目标 一、数据集中趋势的度量(掌握) 二、数据变异程度的度量(掌握) 三、数据的分布形状(掌握) 四、相对位置的度量和异常值的检测(掌握) 五、探索性数据分析(掌握) 六、两变量间关系的度量(掌握) 七、描述性数值度量的缺陷和道德问题(了解) 一、数据集中趋势的度量(掌握) 引 言 集中趋势(Central Tendency)反映的是一组数据向某一中心值靠拢的倾向,对于绝大多数变量来说,总是接近中心值的变量值居多,远离中心值的变量值较少,这样就使得数据分布呈现出向中心值靠拢或聚集的态势。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。根据取得这个中心值的方法不同,我们把测度集中趋势的指标分为两类:数值平均数和位置平均数。这些度量指标也称为平均指标。它们将变量的各变量值差异抽象化,以反映变量值一般水平或平均水平。 引 言 数值平均数是指根据变量的所有数据计算而得的平均数,主要有算术平均数、调和平均数和几何平均数等几种。 位置平均数是根据数据的位置确定的,它通常不是对所有数据进行计算的结果,而是根据处于数据列中特殊位置上的个别或部分数据值来确定的,主要有中位数、众数和四分位数等。 不同类型的数据用不同的集中趋势测度值;低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据 (一)数值平均数:算数平均数 1.算数平均数也简称为平均数,它是最常见最重要的数据集中趋势的度量值。它是一组数据的均衡点所在(就像秋千的支点)。 2.算数平均数只用于数值型数据,不能用于分类数据和顺序数据 3.计算算数平均数只需将数据集中的某个变量的所有观测值加总,再除以观测值的数目之和即可。 (一)数值平均数:算数平均数 4.对一个样本容量为n的样本而言,样本平均数的计算公式如下: (一)数值平均数:算数平均数 3.其它需要说明的问题 (1)总体平均数的计算公式与样本平均数的计算公式是一样的。只不过习惯上用μ来代表总体均值。 (2)由于平均数的计算是建立在变量的每个观测值之上的,因此它受极端值(过大或过小的数据)得影响很大。因此,当数据集有极端值时,平均数并不是对集中趋势的最好的描述。(对居民收入的测量?) (一)数值平均数:算数平均数 (一)数值平均数:调和平均数(补充内容) 1.调和平均数是各变量值倒数的算术平均数的倒数。它是平均数的一种。在计算平均数时,当我们不知道变量值个数,而只知道各组变量值与各组变量总值时,就要先以各组变量总值除以各组变量值求出各组频数;然后再以各组变量总值之和除以各组频数之和,这样所计算的平均数就叫做调和平均数。由于它是根据变量值倒数计算的,所以又称作倒数平均数。 (一)数值平均数:调和平均数(补充内容) 2.由下面一个例子来推导其计算公式: 假如某种蔬菜在早、中、晚市的每斤的单价分别为0.5元、0.4元、0.2元,若早、中、晚市各买一市斤,其平均价格用简单算术平均数计算,结果是0.37元。但若早、中、晚市各买一元钱,其平均价格是多少? 计算方法应先把总重量计算出来,然后再将总金额除以总重量。即: (一)数值平均数:调和平均数(补充内容) 用公式表达即为: (一)数值平均数:调和平均数(补充内容) 3.其它需要指出的问题 (1)调和平均数与算术平均数在本质上是一致的,前者是后者的变形,只是因为原始资料不同而采取的不同计算形式。 (2)调和平均受极端值的影响同样比较大。 (一)数值平均数:几何平均数 1.几何平均数是n个变量值连乘积的n次方根。 2.几何平均数的计算公式如下: (一)数值平均数:几何平均数 (一)数值平均数:几何平均数 3.示例 【例1】某产品生产需要经过六道工序,每道工序的合格率分别为9

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档