统计学第4章数据的概括性度量教材.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
异众比率 异众比率(variation ratio)是指非众数组的频数占总频数的比例,用Vr表示。 异众比率主要适合测度分类数据的离散程度,当然,对于顺序数据以及数值型数据也可以计算异众比率。 异众比率主要用于衡量众数对一组数据的代表程度。异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性越差;异众比率越小,说明非众数组的频数占总频数的比重越小,众数的代表性越好。 Nankai University * 四分位间距 四分位间距( Interquartile Range, IQR )是上四分位数与下四分位数之差。 四分位间距主要用于测度顺序数据的离散程度,对于数值型数据也可以计算四分位间距,但并不适合分类数据。 四分位间距反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。 四分位间距不受极值的影响。 Nankai University * Nankai University Nankai University Nankai University Nankai University Nankai University Nankai University Nankai University Nankai University Nankai University Nankai University Nankai University Nankai University * 第四章 数据的概括性度量 Contents 数据集中趋势的度量 1 数据离散程度的度量 2 数据偏态与峰态的度量 3 Nankai University * 1.数据集中趋势的度量 Nankai University * 集中趋势(central tendency)是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。 众数 中位数 四分位数 平均数 Nankai University * 众数 众数(mode)是一组数据中出现次数最多的变量值,用M0表示。 众数主要用于测度分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。 一般情况下,只有在数据量较大的情况下,众数才有意义 众数是一个位置代表值,它不受数据中极端值的影响。从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。 众数可能不存在,也可能有多个。 Nankai University * 中位数 中位数(median)是一组数据排序后处于中间位置上的变量值,用Me表示。 中位数主要用于测度顺序数据的集中趋势,当然也适用于测度数值型数据的集中趋势,但不适用于分类数据。 中位数是一个位置代表值,其特点是不受极端值的影响。 Nankai University * 计算中位数时,要先对n个数据进行排序,然后确定中位数的位置,最后确定中位数的具体数值。 中位数位置的确定公式为: 设一组数据按从小到大的顺序排序x1,x2,……,xn,则中位数为: Nankai University * 四分位数 四分位数(quartile)也称四分位点,它是一组数据排序后处于25%和75%位置上的值,分别称为下四分位数和上四分位数。 计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。 四分位数位置的确定方法有几种*,每种方法得到的结果会有一定差异,但差异不会很大。设下四分位数为QL,上四分位数为QU,根据四分位数定义有 *一种较为准确的算法是按照下列公式确定位置: , Nankai University * 如果位置是整数,四分位数就是该位置对应的值;如果是在0.5的位置上,则取该位置两侧值的平均数;如果是在0.25或0.75的位置上,则四分位数等于该位置的下侧值加上按比例分摊位置两侧数值的差值。 Q1=第1四分位数,即第25百分位数 Q2=第2四分位数,即第50百分位数 Q3=第3四分位数,即第75百分位数 Nankai University * 平均数 平均数(mean)也称为均值,它是一组数据相加后除以数据的个数得到的结果。 平均数是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。 根据未经分组数据计算的平均数称为简单平均数。 Nankai University * (总体) (样本) 根据分组数据计算的平均数称为加权平均数,设共分成k组,各组组中值分别用M1,M2,…Mk表示,f1,f2,…fk表示各组频数,式中n为样本量 。 计算加权平均数时,用各组的组中值代表各组的实际数据,使用这一代表值时是假定各组数据在组内是均

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档