- 1、本文档共61页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * 组距分组(几个概念) 1. 下限(low limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值,它代表该组变量值的一般水平,它的前提条件是:组内单位的分布是均匀的 下限值+上限值 2 组中值 = 组距变量数列的编制(步骤) 1. 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距d=( 最大值 - 最小值)÷ 组数 此办法适合等距分组,若遇变量值较分散的情况,不可用此方法。组距宜取整数,且是5或10的倍数较好 组距变量数列的编制(步骤) 3.确定各组组限 第一组的的下限应小于或等于最小变量值; 最后一组的上限应大于最大变量值; 各组组限要取整数; 第一组和最后组可取开口组; 4. 统计各组的频数并整理成频数分布表 统计各组频数总原则:不重不漏 对于重叠设置的组限频数统计遵循: 上组限不在内原则 频数分布表的编制(例题分析) 【例】某生产车间50名工人日加工零件数(单位:个)。试对数据进行分组。 频数分布表的编制(步骤) 1. 确定组数:根据 Sturges 提出的经验公式得组数K为: 确定各组的组距: 组距=( 139 - 107)÷ 7≈4.6 ? 5 3. ?用Excel制作频数分布表 等距分组表(上下组限重叠) 相对频数分布和百分数频数分布 按成绩分组(分) 频数(人) 相对数频数 百分数频数 60以下 3 0.075 7.5 60~70 70~80 6 15 0.150 0.375 15.0 37.5 80~90 12 0.300 30.0 90以上 4 0.100 10.0 合计 40 1.000 100.0 二、定量数据的图形表示 直方图 折线图 直方图(histogram) 用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图 直方图下的总面积等于1 直方图的绘制 直方图下的面积之和等于1 某生产车间50名工人日加工零件频数分布直方图 我一眼就看出来了,加工零件在120~125之间的人数最多! 直方图与条形图的区别 条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的 直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义 直方图的各矩形通常是连续排列,条形图则是分开排列 条形图主要用于展示分类数据,直方图则主要用于展示数值型数据 折线图 折线图(line chart)也称频数多边形图。 在直方图的基础上,把直方图中各矩形顶部的中点(即组中值)用直线连接起来,再把原来的直方图抹掉就是折线图。 需要注意,折线图的两个终点要与横轴相交,具体的做法是将第一个矩形的顶部中点通过竖边中点(即该组频数或频率一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴。这样才会使折线图下所围成的面积与直方图的面积相等,从而使二者所表示的频数分布一致。 折线图实例 第四节 探索性数据分析: 茎叶图和箱线图 一、茎叶图 二、箱线图 一、茎叶图(Stem-and-leaf plot) 茎叶图,又称“枝叶图”,由统计学家约翰托奇设计,它是一种同时排列定量数据顺序并提供分布形态的深入信息的探索性数据分析技术 茎叶图由两部分组成:茎(stem)与叶(leaf)。 茎:通常由每组数的高位数值形成,按组竖立在左边; 叶:通常由每组数的低位数值形成,按组横排在“茎”的右边。 茎叶图制作 例[2.11] 某班级40名同学统计学课程考试成绩的数据来说明绘制茎叶图的基本思路。 40名同学统计学课程考试成绩原始数据如下: 68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 76 71 60 91 65 76 72 76 85 89 92 64 57 83 81 78 77
文档评论(0)