第三章_语言统计学集中量数技术分析.ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 集中量数 学习重点: 各种集中量数的概念和性质;各种集中量数的计算方法;各种集中量数的应用。 概念: 集中量数(measures of central tendency)是指用于描述数据集中程度的统计量,包括算术平均数、中数、众数、加权平均数、几何平均数、调和平均数等。它们都是用于度量次数分布的集中趋势。 第一节 算术平均数 学习重点:算术平均数的计算方法、特点和应用。 算术平均数(arithmetic average),是反映一组数据平均水平的统计量。一般简称为平均数(average)或均数、均值(mean)。平均数一般用字母M表示。 一、平均数的计算方法 (一)未分组数据计算平均数的方法 (公式3—1) 式中,∑Xi表示原始分数的总和,N表示分数的个数。 例(3—1) (例3—1)现有一组实验观测数据如下,计算它们的平均数。 25 27 28 27 25 29 30 34 32 33 根据题意,已知N=10,根据公式3—1: (二)用估计平均数计算平均数 如果数据的数目以及每个观测数据值(即数字)都很大时,利用估计平均数可以简化计算。具体方法是先设定一个估计平均数,用符号AM表示,从每一个数据中减去AM,使数值变小,容易计算。最后再在计算结果中加上这个估计平均数。 计算公式如下: 式中:X′=Xi—AM AM为估计平均数 N为数据个数。 例: 例3—l中数据的结果可计算如下:设AM=27 Xi 25 27 28 27 25 29 30 34 32 33 X′-2 0 1 0 -2 2 3 7 5 6 (三) 使用次数分布表计算平均数 当数据编制成次数分布表之后,已看不到原始数据,在这种情况下,一般要使用次数分布表中各分组区间的组中值(Xc)以及各组次数(f)的乘积的和除以N来计算平均数。 计算公式如下: 公式中Xc为各分组区间的组中值,f为各组次数,∑f为数据的总次数(等于N)。 例: 二、平均数的特点 平均数具有如下几个特点: ①在一组数据中每个变量与平均数之差(称为离均差)的总和等于0。 ②在一组数据中,每一个数都加上一常数C,则所得的平均数为原来的平均数加常数C 。 ③在一组数据中,每一个数都乘以一个常数C所得的平均数为原来的平均数乘以常数C 。 三、平均数的意义 算术平均数是应用最普遍的一种集中量数。它是“真值”(true score)渐近、最佳的估计值。 四、平均数的优缺点 优点: (1)反应灵敏。 (2)计算严密。 (3)计算简单。 (4)简明易解。 (5)适合于进一步用代数方法演算。 (6)较少受抽样变动的影响。它总是最可靠、最正确的量数。 缺点: (1)易受极端数据的影响。 (2)若出现模糊不清的数据时,无法计算平均数。 五、计算和应用平均数的原则 1.同质性原则 平均数只有在总体是由同类数据所组成且有足够多的数据单位时,才具有科学价值和认识意义。不同质的数据不能计算平均数。 2.平均数与个体数值相结合的原则 3.平均数与标准差、方差相结合原则 第二节 中数与众数 一、中数 中数(median),又称中点数,中位数,中值,符号为Md或Mdn。中数是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。这个数可能是数据中的某一个,也可能根本不是原有的数。如果将数据依大小顺序排列,中数恰好位于中间,它将数据的数目分成较大的一半和较小的一半。中数是集中量数的一种,它能描述一组数据的典型情况。 中数的求法根据数据是否分组,有不同的方法。 (一)未分组数据求中数的方法 根据中数的概念,首先将数据依其取值大小排序,然后找出位于中间的那个数,就是中数。此时又分几种情况: 1.一组数据中无重复数值的情况 指一组数据中没有相同的数,这时取处于序列中间位置的那个数为中数。此时又可分为两种情况: (1)数据个数为奇数,则中数为(N+1)/2位置的那个数 (2)数据个数为偶数,则中数为居于中间位置两个数的平均数,即第N/2与第(N/2+1)位置的两个数据相加除以2。 2.一组数据中有重复数值的情况 指一组数据中有相同数值的数据,这时计算中数的方法基本与无重复数值的单列数据相同。但根据重复数值数据在该组数据中所处的位置又细分为几种情况。当位于中间的那几个数是重复数值时,求中数的方法就比较复杂了。 (1)当重复

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档