- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.2.2用样本的数字特征估计总体的数字特征 在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。——用样本的数字特征估计总体的数字特征。众数、中位数、平均数思考1:怎样将各个样本数据汇总为一个数值,并使它成为样本数据的中心点?即样本数据有哪些数字特征?1.众数: 在一组数据中,出现次数最多的数据叫做这一组数据的众数.2.中位数: 将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数.3.平均数:一组数据的和除以数据的个数所得到的数. 练习甲在一次射击比赛中的得分如下: ( 单位:环).7, 8, 6, 8, 6, 5, 9, 10, 7, 5,则他命中的平均数是_____,中位数是 众数是_____ 7.175,6,7,82. 某次数学试卷得分抽样中得到:90分的有3个人,80分的有10人,70分的有5人,60分的有2人,则这次抽样的平均分为______.77分取最高矩形下端中点的横坐标2.25作为众数. 思考2:在城市居民月均用水量样本数据的频率分布直方图中,如何从频率分布直方图中估计众数、中位数、平均数呢?你认为众数应在哪个小矩形内?由此估计总体的众数是什么? 频率/组距0.500.400.300.200.10众数:最高矩形的中点O0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t思考3:在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系? 每个小矩形的面积即为所在组的频率,中位数左边和右边的直方图的面积应该相等.即中位数:左右两边直方图的面积相等.频率/组距0.500.400.300.200.10o0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.0.5-0.04-0.08-0.15-0.22=0.01,0.5×(0.01÷0.25)=0.02,所以中位数是2.02. 思考4:平均数是频率分布直方图的“重心”,将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估计平均数. 由此估计总体的平均数是什么?各小矩形底边中点的横坐标为:0.25,0.75,1.25,1.75,2.25,2.75,3.25,3.75,4.25.各小矩形的面积为:0.04,0.08,0.15,0.22,0.25,0.14,0.06, 0.04,0.02.频率/组距0.500.400.300.200.10o0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02(t). 所以平均数是2.02. 思考5:从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗? 频率分布直方图损失了样本数据,得到的是一个估计值,且所得的估计值与数据分组有关.注:在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.思考6:一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?样本数据的平均数大于(或小于)中位数说明什么问题?你怎样理解“我们单位的收入水平比别的单位高”这句话的含义? 课本P74练习:假设你是一名交通部门的工作人员。你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20—100万元人民币。中位数是25万元,平均数是100万元,众数是20万元。你会选择哪一种数字特征来表示国家对每一个项目投资的平均金额?你选择这种数字特征的缺点是什么? 应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息.但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大.三种数字特征的优缺点特征数优 点缺 点众数体现了样本数据的最大集中点无法客观反映总体特征中位数不受少数极端值的影响不受少数极端值的
文档评论(0)