第三章统计数据的特征描述.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章统计数据的特征描述

第3章 统计数据的特征描述 ;§3.1 集中趋势的描述;3.1.1 平均数 平均数:全部数据的算术平均,常用 来表示。是数据集中趋势的最主要测度值。 适用条件:数值型数据 常用形式: ;1.算术平均数(mean) 1) 简单算术平均数 简单算术平均数:全部数据的算术平均 适用条件:未经分组整理的原始数据资料。 计算公式: 式中, 是一组样本数据的观测值,n为样本容量。;【例3.1】 某班级20名学生的期末数学成绩是67、78、49、56、98、87、62、100、73、45、70、44、96、80、49、61、60、88、93、60(分),求该班学生的数学成绩的平均数。 解:由公式(3.1) 该班学生的数学平均成绩是70.8分。;2) 加权算术平均数 加权算术平均数:各组标志值与各组频数相乘的总和除以各组频数之和。 适用:已经分组整理并编制出频数分布的数据资料。 计算公式: 式中, 是单项式分组形式下第i组的变量值或组距式分组形式下第i组的组中值; 是第i组的频数;n为组数。;=0.027+0.298+1.236+0.848+0.610+0.468=3.487 即职工的平均家庭人口数是3.487人;例3.3 (已整理的组距式分组数据平均数算例) 根据第2章中的表2-7中的数据资料计算某单位某种 产品平均销售量的近似值。(见课本P43);2) 加权调和平均数 适用条件:分组资料且各标志值对应的标志总量不等 计算公式: ;3.几何平均数(geometric mean) 适用条件:用于时间上有联系或有先后顺序关系的 比率求平均。 1) 简单几何平均数 计算公式: ;3.1.2 众数 众数(mode):数据中出现次数最多的那个观测值,一般用M0表示。;式中 :L、U分别为众数组的下限和上限。;3.1.3 中位数 中位数(median):将一组数据按一定顺序排列后, 处于中间位置上的变量值,一般用Me表示。 ;例1:4,4,3,2,2,2,1,3,1;2.根据分组数据计算中位数;LMe表示中位数所在组的下限; ;3.1.4 分位数;例:第一组数据:2300、3500、2900、4500、7000、 3000、8100、3200(万元),计算两组数据的四分位数。 解:按从小到大顺序的排列结果为 2300、2900、3000、3200、3500、4500、7000、8100;2.根据分组数据计算四分位数;L1和L3表示下四分位数和上四分位数所在组的下限; ;3.1.5 集中趋势各测定指标之间的区别与关系 ;关系;§3.2 离散程度的描述;3.2.1 极差和四分位差 ;3.2.2 方差和标准差;分组数据资料计算公式: ;注: 方差和标准差是根据全部数据计算的,它能比较准确地反映出全部数据的离散程度。 标准差有计量单位的且与变量值相同,因此其实际意义要比方差清楚。在对社会经济现象进行分析时,更多地使用标准差作为离散程度的度量值。 方差与标准差都不是系数,因此对不同数据不能通过比较它们的大小得出离散程度的大小。;3.2.3 变异系数和异众比率;计算公式: ;§3.3 分布形态的描述;3.3.1 偏度; 对称分布 右偏分布 左偏分布;3.3.2 峰度;(1) 当数据分布与标准正态分布的陡缓程度相同 时,则峰度值等于零。 (2) 当数据分布的形状比标准正态分布更尖时,则 峰度值Ku0,称为尖峰态分布。尖峰分布表明集 中趋势显著,离散程度低。 (3) 当数据分布的形状比标准正态分布更平时,则 峰度值Ku0,称为平峰态分布。平峰分布表明集 中趋势不显著,离散程度大。;Ch3 小结

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档