《统计学 第二章统计数据的描述》.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 统计数据的描述 ;第一节 统计数据的整理 第二节 分布集中趋势的测度 第三节 分布离散程度的测度 第四节 分布偏态与峰度的测度 第五节 统计表和统计图;学习目标;录取中有无歧视?;两个系的报考及录取情况;2.1 统计数据的整理;统计整理;制定统计整理方案;数据的审核 ;数据的排序(data rank);世界人均国民总收入;2.1.1 统计数据的分组;统计分组的基本原则: 必须保证在某一标志上,组内的同质性和组间的差异性。 分组兼有“分和合”双重含义 ;;统计分组的关键: 1、选择分组标志 : 品质标志(性别、质量等) 数量标志(数量、数值等) 2、划分各组界限; 学生按性别分组;某班学生按考试成绩分组;按数量标志分组;2.1.2 次数分配; 次数分配是将总体按一定的标志分组,说明个体在各组之间的分布情况。是统计资料整理结果的一种重要表现。;分组方法;单变量值分组 (要点);例题分析;单变量值分组表(实例);组距分组(要点);工人按月工资额分组(元);不等距分组 各组的组距是不相等 各组频数的分布受组距大小不同的影响;等距分组步骤; 2) 确定各组的组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=(最大值 - 最小值)÷组数 例2.1的数据,最大值为128,最小值为84,则 组距=(128 - 84)/6=7.3。 组距宜取5或10的倍数;(近似值) 在实践中,组数和组距要通过反复的实验确定,最终确定出最有意义的组数和组距的组合。;3)确定组限:组限是分组的数量界限,是表明每组界限的两头数值。 下 限(low limit) :一个组的最小值 上 限(upper limit) :一个组的最大值 组限的具体形式有:重合组限和间断组限;闭口组限和开口组限。 确定组限的原则1:最小一组的下限必须包含数列中最小变量值;最大组的上限必须包含数列中最大变量值。 确定组限的原则2:遵循不重不漏的原则。 ★“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现; ★“不漏”在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。 ;4)根据分组计算频数,整理成频数分布表:将原始数据按照各自的大小分配到各组中。; 对于重合组限的形式,为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于其一组上限的变量值不算在本组内,而计算在下一组内。 重合组限既适用于连续型变量分组也适用于离散型变量分组,应用非常广泛。;对于离散变量,可以采用相邻两组组限间断的办法(间断组限)解决“不重”的问题。;如果全部数据中的最大值和最小值与其他数据相差悬殊,为避免出现空白组或个别极端值被漏掉,第一组和最后一组可以采取“x x以下”及“x x以上”这样的开口组。 开口组通常以相邻组的组距作为其组距。 例如,在例2—1的30个数据中,假定将最小值改为64,最大值改为160,采用上面的分组就会出现“空白组”,这时可采用“开口组”,如80以下;130以上。;按周加工零件数分组;编制频数分布表的步骤; 在研究分析次数分布时,还需要计算:累计频数和累计频率;表 某车间工人周零件数的频数分布表; 在根据组距数列进行统计计算时,需要确定组中值,作为各组变量值的代表值。 组中值(class midpoint) :下限与上限之间的中点值。;例:组中值计算;在开口组中,组中值的计算以邻近组组距为依据;例:组中值计算;次数分配表的编制 (例题分析);使用Excel频数函数 (FREQUENCY);次数分配表;2.1.3 次数分配直方图;1. 直方图 ;分组数据的图示 (直方图的绘制);2.折线图;分组数据的图示 (折线图的绘制);3.次数分布曲线;频数分布曲线的类型;2.1.4 洛伦兹曲线与基尼系数;洛伦茨曲线(累积次数分配折线图);基尼系数 ;2.2 分布集中趋势的测度 ;数据集中区;一、众数 二、中位数 三、四分位数 四、均值 五、几何均值 六、切尾均值 七、众数、中位数和均值的比较;1.概念:在总体中出现次数最多的那个标志值就是众数。;;M0;下三图无众数:;1)定类数据的众数 ;2)定序数据的众数;① 根据单项数列

文档评论(0)

tangdequan1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档