1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
05 差异量

第五讲 差异量 描述数据离散程度的统计量称为差异量。差异量越大,表明数据越分散、不集中;差异量越小,表明数据越集中,变动范围越小。 一组数据的离散程度,常常通过数据的离中趋势特点进行分析。 一、全距、四分位距和百分位距 全距 R (range) 全距是一组数据中的最大值(maximum)与该组数据中最小值(minimum)之差,又称极差。 R=Xmax-Xmin 百分位差(百分位距) 百分位差是指两个百分位数(percentile)之差。 常用的百分位距有两种: P90-P10和 P93-P70 用几个百分位距能较好地反映一组数据的差异程度。 计算公式 公式中:fbp为某一百分位数所在组下限以下的累积 频数    fp为某一百分位数所在组的频数    Lbp为某一百分位数所在组的精确下限 四分位距 四分位距是第一个四分位数与第三个四分位数之差的一半,计算公式为 其中: 二、平均差 平均差(average deviation 或者 mean deviation)是指一组数据中,每一个数据与该组数据的平均数离差的绝对值的算术平均数,通常用AD或MD表示。 本书中均以AD表示。 原始数据计算公式 次数分布表计算公式 三、方差和标准差 方差(又称为变异数、均方)。是表示一组数据离散程度的统计指标。一般样本的方差用 表示,总体的方差用 表示。 标准差(standard deviation)是方差的算术平方根。一般样本的标准差用 S 表示,总体的标准差用 表示。 标准差和方差是描述数据离散程度的最常用的差异量。 1.方差和标准差的定义 2.方差和标准差的计算公式 原始数据计算公式 次数分布表计算公式 表5-1 52名学生数学成绩方差和标准差计算表 3.总标准差的合成 方差具有可加性的特点。当已知几个小组数据的方差或标准差时,可以计算几个小组联合在一起的总的方差或标准差。 需要注意的是,只有在应用同一种观测手段,测量的是同一种特质,只是样本不同的数据时,才能计算合成方差或标准差。 计算公式 4.方差和标准差的性质 方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。 标准差是一组数据方差的算术平方根,它不可以进行代数计算,但有以下特性: 5.方差和标准差的意义 方差与标准差是表示一组数据离散程度的最好指标,是统计分析中最常用的差异量。 标准差具备一个良好的差异量应具备的条件,如:反应灵敏,有公式严密确定,简明易懂,适合代数运算等等。 应用方差和标准差表示一组数据的离散程度,须注意必须是同一类数据(即同一种测量工具的测量结果),而且被比较样本的水平比较接近。 四.相对差异量 1.差异系数的概念及计算公式 差异系数(coefficient of variation)是指标准差与其算术平均数的百分比,它是没有单位的相对数。常以CV表示,其计算公式为 2.差异系数的作用 比较不同单位资料的差异程度 比较单位相同而平均数相差较大的两组资料的差异程度 可判断特殊差异情况 根据经验,一般CV值常在5%-35%之间。如果CV大于35%时,可怀疑所求得的平均数是否失去了意义;如果CV小于5%时,可怀疑平均数与标准差是否计算有误。 例1:比较计量单位不同的数据资料的差异程度 1975年上海市区6岁男童体重与身高数据: 例2:比较单位相同而平均数相关较大的两组资料的差异程度。 3.差异系数的应用条件 差异系数主要应用于平均数不等于零的连续数据。 学科成绩可以勉强计算差异系数。 练习与思考 对一组数据进行描述时,应怎样选择合适的集中量和差异量? 再见! 2010年3月 * * (5.1) (5.2a) (5.2b) 用中位数作集中量时,常用四分位距作差异量。 (5.3) (5.4) 平均差意义明确,计算容易,反应灵敏。但计算时要用绝对值,不适合代数运算,因此在进一步统计分析中应用较少。 (5.5) (5.6) (5.7) (5.8) 公式(5-5)、(5-6)等价于(5-7)、(5-8),当两个公式计算结果有出入时,应以原始数据计算公式的结果更准确。 (5.9) (5.10) 280525 2256.25 5512.5 13225 19531.25 41006.25 57818.75 48050 34031.25 22968.75 17112.5 19012.5 F*XC2 3775 47.5 105 230 312.5 607.5 797.5 620 412.5 262.5 185 195 F*Xc 1 47.5 45- 52.5 57.5 62.5 67.5 72.5 77.5 82.5 87.5 92.5 97.5 组中值Xc 52 2 4 5 9 11 8 5 3 2 2 频数f 合计 50

您可能关注的文档

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档