2013-2014-1统计学第四章.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 第四章 数据的描述性分析 本章内容 第一节 集中趋势的描述 第二节 离散程度的描述 第三节 分布的偏态与峰度 集中趋势 集中趋势反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多,而远离中心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。 算术平均数 算术平均数是总体中各个体的某个数量标志的总和与个体总数的比值,一般用符号 表示。 ◆简单算术平均数 ◆加权算术平均数 ◆算术平均数的数学性质 4 90分以上 10 80-90 22 70-80 8 60-70 2 60分以下 案例1:甲班《统计学》考试情况如下表: 案例2:乙班《统计学》考试情况如下表: 1 90分以上 4 80-90 8 70-80 30 60-70 2 60分以下 案例3:丙班《统计学》考试情况如下表: 7 90分以上 25 80-90 12 70-80 5 60-70 2 60分以下 问题 1、计算甲、乙、丙三个班的平均成绩;该平均值是真实值还是近似值?如是近似值,什么情况下会是真实值? 2、计算甲、乙、丙三个班的中位数、众数; 3、如要选择从算术平均数、中位数和众数三个平均数中选择一个数来分别代表甲、乙、丙三个班的整体水平,请问你会选择哪个平均数?为什么? 4、如要分别反映甲、乙、丙三个班的考试情况,你会选择用哪些指标来衡量? 5、如要比较甲、乙、丙三个班的考试情况的优劣,你又会选择什么样的指标来衡量? 6、甲乙丙三个班的考试成绩分别服从对称分布、左 偏分布、右偏分布中的哪种分布?为什么? 先计算各组的累计次数,再按公式 确定 中位数的位置,并对照累计次数确定中位数。 由组距数列确定中位数 下限公式: 为中位数组的下限; 为总次数; 为中位数组前一组的向上累计次数; 为中位数组的次数; 为中位数组的组距。 众数 众数是一组数据中出现次数最多的那个变量值,通常用M0表示。 ◆由未分组数据确定众数 ◆由单项数列确定众数 ◆由组距数列确定众数 组距式变量数列计算众数的公式: 对比 1. 众数、中位数和算术平均数的关系 2. 众数、中位数和算术平均数的特点与应用场合 * 2、几何平均数 各个比率或速度的连乘积等于总比率或总速度; 相乘的各个比率或速度不为零或负值。 使用几何平均数的条件: 用处:用于计算比率、发展速度的平均值。 * 【例】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95﹪、92﹪、90﹪、85﹪、80﹪,求整个流水生产线产品的平均合格率。 分析: 设最初投产100A个单位 ,则 第一道工序的合格品为100A×0.95; 第二道工序的合格品为(100A×0.95×0.92) ; …… 第五道工序的合格品为 (100A×0.95×0.92×0.90×0.85×0.80; 因该流水线的最终合格品即为第五道工序的合格品, 故该流水线总的合格品应为 100A×0.95×0.92×0.90×0.85×0.80; 则该流水线产品总的合格率为: 即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。 因该流水线的最终合格品即为第五道工序的合格品, 故该流水线总的合格品应为 100A×0.95×0.92×0.90×0.85×0.80; 则该流水线产品总的合格率为: 解: 加权几何平均数 当计算几何平均数的各种变量值出现的次数不等时,即数据经过了统计分组时,则应采用加权几何平均数。若以 表示第 组的变量值,以 表示第i 组的频数,以k 表示分组数,则加权几何平均数的计算公式为: 【例】某金融机构以复利计息。近12年来的年利率有4年为 3﹪,2年为5﹪,2年为8﹪,3年为10﹪,1年为15﹪。求平均年利率。 设本金为V,则至各年末的本利和应为: 第1年末的本利和为: 第2年末的本利和为: ……… ……… 第12年末的本利和为: 分析: 第2年的计息基础 第12年的计息基础 则该笔本金12年总的本利率为: 即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。 解: 数据标准化 标准化数值是变量值与其平均数的离差除以标准差后的值,也称为z分数或标准分数。设标准化数值为z,则有: 偏态 偏态是对分布偏斜方向和程度的测度。变量分组后,总体中各个体在不同的分组变量值下分布并不均匀对称,而呈现出偏斜的分布状况,统计上将其称为偏态分布。 偏态系数的数值一般在0与±3之间,越接近0,分布的偏斜度越小;越接近±3,分布的

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档