应用统计-5.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用统计-5

第五章 变异与均衡指标 一、变异指标 二、偏度峰度 三、均衡指标 一、变异指标 一个班学生的经济学成绩视为一组数据的话,他们的成绩水平如何(是高是低),我们用这组数据的平均指标来描述和判定;他们的成绩差异如何(是整齐还是不整齐,是学生之间成绩差异大还是差异小),我们用这组数据的变异指标来描述和判定。 变异指标是反映数据的差异程度或离散程度的一种指标。 平均指标说明数据的集中趋势,而变异指标则说明数据的离中趋势。 变异指标种类 (1)全距(极差) (2)四分位距(四分位差) (3)平均差 (4)方差 (5)标准差 (6)标准差系数 全距(极差):R = Xmax - Xmin 四分位距(四分位差): Qr = Q3 - Q1 例如,有两组工人日产量(件)资料如下: 甲组 10 11 11 12 12 12 12 13 13 14 乙组 4 4 6 9 12 13 15 17 20 20 甲乙两组的全距分别为 甲组R=14 - 10=4(件) 乙组R=20 - 4=16(件) 平均差克服了全距、四分位距等都未全面考虑所有数据以确定变异指标的不足,以各数据值与其算术平均数离差绝对值的平均数作为衡量数据变异程度的指标。 计算前例甲、乙两组平均差分别为 甲组A.D. = 0.8 乙组A.D. = 5 计算结果为乙组平均差大于甲组,说明乙组较甲组变异大,乙组平均指标的代表性较甲组为弱。 方差和标准差是测度数据变异程度的最重要最常用的指标。 方差是各个数据与其算术平均数的离差平方的平均数,通常以σ2表示。 方差的计量单位和量纲不便于从经济意义上进行解释,所以实际统计工作中多用方差的算术平方根----标准差来测度统计数据的差异程度。 标准差又称均方差,一般用σ表示。 标准差计算举例 标准差系数 标准差虽是一种理想的变异指标,但其数值大小除受标志值本身变异程度的影响外,还与标志值的水平高低及计量单位直接关联。因此,对于水平不等的总体、单位不同的标志,不能直接以标准差数值大小而论其变异程度高低。 标准差系数( 以Vσ表示 )是标准差与算术平均数的比值,克服了标准差在比较中的局限,可直接用于不同标志值数列的变异程度的对比或评价。其计算公式为 标准差系数计算举例 甲组日产量(件):60、65、70、75、80 乙组日产量(台): 2、 5、 7、 9、12 二、偏度峰度 全面描述数据分布,除描述其集中趋势和离中趋势的特征,还需描述其分布的态势:对比正态分布基准,数据的分布是对称的还是非对称的(偏斜的)-- 偏度;数据的分布分布是平顶的还是尖顶的--峰度。 描述数据分布的偏度和峰度的统计指标之一是动差或矩。 动差 动差(又称矩),原是物理学上用以表示力与力臂对重心关系的术语。统计学上标志值与权数对平均数的关系,与此种关系十分相似。因此,统计学借用动差概念,描述次数分布的某些性质或特征。 一般地说,标志值与任意数(A)之差的K次方的算术平均数,称为标志值关于的K阶动差。 一阶原点动差即为算术平均数,二阶中心动差即为方差(标准差的平方)。所以,次数分布的集中趋势和离中趋势等特征,皆可由动差描述。 偏度 笼统地说,偏度是指数据分布的(非)对称形态及程度。依算术平均数与众数的大小关系偏度分为两种:一为右偏态分布,简称右偏或正偏;一为左偏态分布,简称左偏或负偏。 严格地说,偏度是指偏态分布(包括正偏、负偏)的偏斜程度。而偏度的描述或测定,就是运用适当的指标或方法,度量分布偏斜程度的大小,揭示分布的形态特征。 偏度指标计算 1)皮尔逊指标: 以标准差为单位的算术平均数与众数的离差 2)三阶动差指标: 分布负偏,三阶中心动差为负数;分布正偏,则为正数。为消除三阶中心动差立方单位的影响,也为不同水平数列偏度的直接比较,须将三阶中心动差除以标准差的三次方,以获得数列偏度的相对度量。 偏度指标计算举例 P.180 m3 = - 395750 , σ= 119.48 α3 = 395750/119.483 = -0.230 计算结果表明,该数据呈轻微左偏分布。 峰度 峰度是数据分布的一种性质或特征。这一特征是指某一数据的分布曲线与正态分布曲线相比较,是尖顶、还是平顶,其尖顶或平顶的程度如何。 峰度通常分为三种:尖顶峰度、正态峰度和平顶峰度。当数据的频数更密集分布于众数左右,使分布曲线较正态分布曲线更为尖耸,为尖顶峰度;当数据的频数完全符合正态分布的规律,分布曲线与正态分布曲线完全一致,为正态峰度,又称为标准峰度;当数据的频数更离散分布于众数

文档评论(0)

zw4044 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档