2.2.2用样本的数字特征估计总体的数字特征研究.ppt

2.2.2用样本的数字特征估计总体的数字特征研究.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
解:用计算器计算可得: 从样本平均数看,甲生产的零件内径比乙生产的更接近内径标准(25.40mm),但是差异很小;从样本标准差看,由于 解: 依题意计算可得 x1=900 x2=900 s1≈23.8 s2 ≈42.6 甲乙两种水稻6年平均产量的平均数相同,但甲的标准差比乙的小,所以甲的生产比较稳定. 解 : (1) 平均重量约为496.86 g , 标准差约为6.55 (2)重量位于(x-s , x+s)之间有14袋白糖,所占 百分比为66.67%. 解:平均数x≈19.25, 中位数为15.2, 标准差s≈12.50. 这些数据表明这些国家男性患该病的平均死亡率约为 19.25, 有一半国家的死亡率不超过15.2, x 15.2 说 明存在大的异常数据, 这些异常数据使得标准差增大. * * * * * * * * * * * * * * * * * 用样本的数字特征估计总体的数字特征 用样本的数字特征估计总体的数字特征 怎样将各个样本数据汇总为一个数值,并使它成为样本数据的中心点? 能否用一个数值来描写样本数据的离散程度? 一 众数、中位数、平均数的概念 中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. 众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. 众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛. 平均数: 一组数据的算术平均数,即 x= 练习: 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示: 成绩 (单位:米) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90 人数 2 3 2 3 4 1 1 1 分别求这些运动员成绩的众数,中位数与平均数  解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.   上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;  这组数据的平均数是  答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米). 二 、 众数、中位数、平均数与频率分布直方图的关系 1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。 例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如图所示: 频率分布直方图如下: 月均用水量/t 频率 组距 0.10 0.20 0.30 0.40 0.50 0.5 1 1.5 2 2.5 3 3.5 4 4.5 2、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02t. 频率分布直方图如下: 月均用水量/t 频率 组距 0.10 0.20 0.30 0.40 0.50 0.5 1 1.5 2 2.5 3 3.5 4 4.5 说明: 2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致. 3、平均数是频率分布直方图的“重心”. 等于频率分布直方图中每个小矩形的面积 乘以小矩形底边中点的横坐标之和. 下图显示了居民月均用水量的平均数: x=2.02 频率分布直方图如下: 月均用水量/t 频率 组距 0.10 0.20 0.30 0.40 0.50 0.5 1 1.5 2 2.5 3 3.5 4 4.5 三 三种数字特征的优缺点 1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少. 2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不

文档评论(0)

a336661148 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档