* * * 从上面这些数字,我们很容易发现的居民的月均用水量的最小值 是 0.2 t,最大值是4.3 t.其他在 0.2至4.3之间。很难再发现其他信息。我们很难从随意记录的数据中直接看出规律。为此,我们需要对统计数据进行整理与分析。 第二章 统计 2.2.1 用样本的频率分布估计 总体分布 我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ? 探究: 你认为,为了较为合理地确定出这个标准,需要做哪些工作? 复习引入: (1)统计的核心问题: 如何根据样本的情况对总体的情况作出推断 简单随机抽样 系统抽样 分层抽样 (3)通过抽样方法收集数据的目的是什么? 从中寻找所包含的信息,用样本去估计总体 (2)随机抽样的几种常用方法 : 我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢 ? 探究: ①采用抽样调查的方式获得样本数据 ②分析样本数据来估计全市居民用水量的分布情况 下表给出100位居民的月均用水量表 分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式 讨论:如何分析数据? 根据这些数据你能得出用水量其他信息吗? 为此我们要对这些数据进行整理与分析 画频率分布直方图的一般步骤: 1、求极差(最大值与最小值的差) 2、决定组距与组数(将数据分组) 组数=极差/组距 当样本容量不超过100时,组数一般为5~12组 5、画频率分布直方图 4、画频率分布表 二、频率分布直方图 3、将数据分组 〈一〉频率分布的概念: 频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布 〈二〉画频率分布直方图其一般步骤为: (1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 第一步: 求极差: (数据组中最大值与最小值的差距) 最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1 第二步: 决定组距与组数: (强调取整) 当样本容量不超过100时, 按照数据的多少, 常分成5~12组. 为方便组距的选择应力求“取整”. 本题如果组距为0.5(t). 则 第三步: 将数据分组:( 给出组的界限) 所以将数据分成9组较合适. [0, 0.5), [0.5, 1), [1, 1.5),……[4, 4.5) 共9组. 第四步: 列频率分布表. 分组 频数 频率 频率/组距 [0-0.5) 4 [0.5-1) 8 [1-1.5) 15 [1.5-2) 22 [2-2.5) 25 [2.5-3) 15 [3-3.5) 5 [3.5-4) 4 [4-4.5) 2 合计 100 组距=0.5 0.04 0.08 0.08 0.16 0.3 0.15 0.44 0.22 0.25 0.5 1 2.00 0.02 0.04 0.04 0.08 0.1 0.3 0.15 0.05 0 0.1 0.2 0.3 0.4 0.5 0.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5 第五步: 画出频率分布直方图. 频率/组距 月均用水量/t (组距=0.5) 0.08 0.16 0.3 0.44 0.5 0.3 0.1 0.08 0.04 小长方形的面积=? 小长方形的面积总和=? 月均用水量最多的在哪个区间? 请大家阅读第68页,直方图有哪些优点和缺点? 频率分布直方图的特征: 从频率分布直方图可以清楚的看出数据分布的总体趋势。 从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。 思考: 1.频率分布表与频率分布直方图的区别? 频率分布表列出的是在各个不同区间内取值的频率。 频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率。 2.如
原创力文档

文档评论(0)