第2章 数据的收集及整理.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章 数据的收集及整理

三、众数、中位数与均值的比较 频数分布正偏(右偏):众数<中位数<均值 频数分布负偏(左偏),均值<中位数<众数 常用的平均指标汇总 指标名称 简单平均数 公式 加权平均数公式 算术平均数 调和平均数 几何平均数 中位数 将总体标志值按大小顺序排列,处于中间位置的标志值 众数 总体中出现次数最多的标志值 3.2.2 刻画数据离散程度的特征量 变量的离散程度(变异程度) 反映总体各变量值对其平均数这个中心的离中趋势。变异指标与平均指标分别从不同的侧面反映总体的数量特征。 数据的变 异程度 产品质量检查的结果 说明生产 是否稳定 学 生 的 成 绩 成绩是 否整齐 (而不是高低) 4.2 数据分布的离散趋势测度 数据的特征和度量 集中趋势 算术平均数 调和平均数 几何平均数 中位数 众数 百分位数 四分位数 离中趋势 极差 四分位距 平均差 方差与标准差 标准分数 离散系数 分布形状 偏态测度 峰态测度 一、极差 极差(Range)也叫全距,常用R表示,它是一组数据的最大值与最小值之差,即: 极差表明数列中各变量值变动的范围。 R越大,表明数列中变量值变动的范围越大,即数列中各变量值差异大; R越小,表明数列中变量值的变动范围越小,即数列中各变量值差异小。 二、四分位距 四分位距(quartile deviation)是度量变异数的另一种方法,也称为内距或四分位差,是第一四分位数(下四分位数Q1)与第三四分位数(上四分位数Q3)的差,也就是75%百分位数与25%百分位数间的距离。 它代表分布中间50%的距离。常用表示IQR,其计算公式为: 三、平均差 平均差(mean deviation)是变量数列中各个变量值与算术平均数的绝对离差的平均数,常用MD表示。 各变量值与平均数的离差的绝对值越大,平均差也越大,则说明变量值变动大,数列离散趋势越大;反之亦然。 根据所给资料的形式不同,对平均差的计算可以划分为简单和加权式平均差两种形式。 (一)简单平均差 对未经分组的数据资料,采用简单平均差,公式如下: (二)加权式 根据分组整理的数据(知道频数)计算平均差,应采用加权式,公式如下: 四、方差与标准差 方差(variance)是变量数列中各变量值与其算术平均数差的平方。 标准差(standard deviation)是方差的平方根,故又称均方差或均方差根,其计量单位与平均数的计量单位相同。 根据给定资料的不同,对方差和标准差的求解也可以分为两种形式。 (一)简单式 对未经分组的数据资料,采用简单式,公式如下: 总体方差的计算公式: 总体标准差的计算公式: (二)加权式 根据分组整理的数据计算标准差,应采用加权式,公式如下: 总体方差: 总体标准差: 五、相对离散程度的度量 前面介绍的极差、四分位差、平均差和标准差都是反映数据分散程度的绝对值. 因此,在对比分析中,不宜直接用上述各种标志变异指标来比较不同水平数列之间的离散程度,而需要用相对离散系数来反映数列的离散趋势。 (一)标准分数 标准分数(standard score)也称标准化值或分数,它是变量值与其平均数的离差除以标准差后的值,是对每个数据在该组数据中相对位置的测量。常用字母z表示。 例如:某中学高(1)班期末考试,已知语文期末考试的全班平均分为73分,标准差为7分,甲得了78分;数学期末考试的全班平均分为80分,标准差为6.5分,甲得了83分。甲哪一门考试成绩比较好? 因为两科期末考试的标准差不同,因此不能用原始分数直接比较。需要将原始分数转换成标准分数,然后进行比较。 Z(语文)=(78-73)/7=0.71 Z(数学)=(83-80)/6.5=0.46   甲的语文成绩在语文平均分之上高0.71个标准差;他的数学成绩在其整体分布中位于平均分之上0.46个标准差的地位。由此可见,甲的语文期末考试成绩优于数学期末考试成绩。 (一)标准分数 切贝舍夫定理:至少有(1-1/k2)的数据落在标准分数K倍标准差之内,K为1的任意数. 经验表明,不管分布状态如何,按照著名的“切贝舍夫定理”,至少有 75% 的数据位于 ,89%的数据位于 ; 当一组数据对称分布时,大约有68%的数据在范围内 ;大约有95%的数据在的范围内 ;而在的范围内大约有98%的数据 。 100个同学的英语平均成绩是70分,标准差是5分,则有多少同学的成绩在 60-80分之间 55-85分之间 K分别是2和3,则: (二)离散系数 离散系数(Coefficient of variatio

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档