- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用---样数字特征解析
* * 2.2 用样本估计总体 2.2.2用样本的数字特征估计总体的 数字特征 第一课时 中数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. 众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. 众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛. 一 、 众数、中位数、平均数的概念 平均数: 一组数据的算术平均数,即 概念 关系 特点 应用 返回 上 下 问题1:如何从频率分布直方图中估计众数? 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 取最高矩形下端中点的横坐标2.25作为众数. 以“居民月均用水量”的频率分布直方图为例,估计其众数. 众数的特点: (1)众数容易计算. (2)众数只能表示数据中很少的一部分信息. 前进 后退 问题2:如何从频率分布直方图中估计中位数? 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 思考1:在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系? 样本数据中有一半数小于或等于样本中位数,另一半数大于或等于样本中位数,这个特点在图中表现为: 前进 后退 中位数两边直方图面积相等. 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 思考2:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么? 中位数是2.02 前进 后退 0.5-0.04-0.08-0.15-0.22=0.01, 0.01÷0.5=0.02 思考3:极少数居民用水量太高,是否会对中位数产生影响?由此中位数有怎样的特点? 无影响. 中位数的特点 中位数易计算,能较好的表现数据信息. 中位数不受少数极端数据的影响. 常用于数据质量较差(即存在一些数据错误)时. 思考4:2.02这个中位数估计值与样本的中位数2.0不一样,为什么? 频率分布直方图损失了一些样本数据,得到的是一个估计值. 思考5:课本P73思考. 前进 后退 问题3:如何从频率分布直方图中估计平均数? 将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的平均数估计值. 由此估计总体的平均数是什么? 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 平均数的特点 平均数能够反映出更多关于样本数据全体的信息. 任何一个样本数据的改变都会影响到平均数的变化. 平均数受极端值影响较大. 平均数主要用于数据质量较好的前提下. 0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02= 2.02 (t) 说明:如果样本平均数大于样本中位数,说明样本中存在许多较大的极端值;反之,说明样本中存在许多较小的极端值. 前进 后退 三 三种数字特征的优缺点 1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征. 2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。 3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此 ,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。 如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少. 如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。 概念 关系 特点 应用 返回 上 下 思考6:(P73探究)你怎样理解“我们单位的收入水平比别的单位高”这句话的含义? 这句话具有模糊性甚至蒙骗性,其中
文档评论(0)