- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
初中我们曾经学过频数分布表和频数分布图,这使我们能够清楚地知道数据分布在各个小组的个数. (2011·湖北高考)有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( ) 数据 根据样本的情况对总体的相应情况作出估计和推断 3.随机抽样的三种常用方法 简单随机抽样、系统抽样、分层抽样 2.统计学研究问题的步骤 三步骤:收集数据、整理数据、统计推断。即通过抽样方法收集数据的目的是从中寻找所包含的信息,用样本去估计总体。 统计学的核心思想是 我国是世界上严重缺水的国家之一,城市缺水问题较为突出. 2000年全国主要城市中缺水情况排在前10位的城市 巢湖市市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部分按议价收费. (1)如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢? (2)为了较合理地确定这个标准,你认为需要做 哪些工作? 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 这些数字告诉我们什么信息? 通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表: 很容易发现的是一个居民月平均用水量的最小值时0.2t,最大值是4.3t,其他在0.2t~4.3t之间. 分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式. (一)从数据中提取信息, (二)利用图形传递信息。 下面将要学习的频率分布表和频率分布图,则是从各个 小组数据在样本容量中所占比例大小的角度,来表示数据分布 的规律. 它可以使我们看到整个样本数据的频率分布情况. 频率分布相关概念 频率:样本中某个组的频数和样本容量的比,叫做该数据的频率。 频率分布的表示形式有: ①样本频率分布表 ②样本频率分布直方图 ③样本频率分布折线图 所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。 频数:在统计学中,将样本按照一定的方法分成若干 组,每组内含有这个样本的个体的数目叫做频数 第一步: 求极差 (一组数据中的最大值与最小值的差). 知识探究(一):样本频率分布表 思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么? 0.2~4.3 思考2:分成多少组合适呢? 第二步: 决定组距与组数: 组距:指每个小组的两个端点的距离; 组数:k=极差÷组距,若k为整数, 则组数=k,否则,组数=[k]+1. 将数据分组,当数据在100个以 内时, 按数据多少常分5-12组。 (4.3-0.2)÷0.5=8.2. 将8.2取整 故,可取组距=0.5,组数=9 如果将上述100个数据按组 距为0.5进行分组,那么这 些数据共分为多少组? 第四步:列频率分布表. 计算各小组的频率,作出 下面的频率分布表. 第三步:确定分点,将数据分组. 以组距为0.5将数据分组时, 可以分成以下9组: [0,0.5),[0.5,1),…,[4,4.5]. 知识探究(一):频率分布表 思考3:各组数据的取值范围可以如何设定? 各组均为左闭右开区间, 最后一组是闭区间 思考4: 如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗? 列频率分布表: [4,4.5] 合计 [3.5,4) [3,3.5) [2.5,3) [2,
文档评论(0)