用样本的数字特征估计总体的数字特征(讲授课).pptxVIP

用样本的数字特征估计总体的数字特征(讲授课).pptx

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
问题提出1.对一个未知总体,我们已经学过的用样本分布估计总体分布的方法有哪些? 2.它们各有什么优缺点? 频率分布表和频率分布直方图能够很容易表示大量数据,非常直观地表明其分布形状,使我们能够看到许多隐藏在数据后的信息,但是,损失了一些样本数据的信息,不能保留原有数据。 茎时图由所有样本数据组成,没有损失任何样本信息,可以在抽样过程中随时记录,但是,只能适用于样本容量较小时。 3.对于样本容量较大的样本,为了从整体上更好地把握总体规律,我们该如何处理呢?第一页,共十九页。2.2.2 用样本的数字特征估计总体的数字特征 第二页,共十九页。一 众数、中位数、平均数的概念 众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. 中数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. 平均数: 一组数据的算术平均数,即 x=第三页,共十九页。复习运用众数中位数平均数第四页,共十九页。探究1:众数、中位数和平均数 取最高矩形下端中点的横坐标2.25作为众数. 思考1:如何从频率分布直方图中估计众数、中位数、平均数? 思考2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么? 频率组距0.50.40.30.20.1O0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t第五页,共十九页。频率组距0.50.40.30.20.1O0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t思考3:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么? 0.5-=0.01,设小矩形的宽为X,则:0.5X=0.01,得X=0.02,所以中位数是2+0.02=2.02. 第六页,共十九页。思考4:平均数是频率分布直方图的“重心”,在下面的频率分布直方图中,各个小矩形的重心在哪里?从直方图估计总体在各组数据内的平均数分别为多少?频率组距0.25,0.75,1.25,1.75,2.25,2.75,3.25,3.75,4.25. 0.50.40.30.20.1月均用水量/tO0.5 1 1.5 2 2.5 3 3.5 4 4.5 样本数据的估计平均数就是将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加. 由此估计总体的平均数就是0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02(t). 第七页,共十九页。思考5:从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗? 在制作频率分布直方图“丢失”了一些样本数据,得到的是一个估计值,且所得估计值与数据分组有关.注:在只有样本频率分布直方图的情况下,才可按上述方法估计众数、中位数和平均数,并由此估计总体特征.第八页,共十九页。二、三种数字特征的优缺点: 1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。 如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少。第九页,共十九页。 2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。 如上例中假设有某一用户月均用水量为1000t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。第十页,共十九页。 3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。 与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。 第十一页,共十九页。三种数字特征的优缺点第十二页,共十九页。第十三页,共十九页。第十四页,共十九页。练习:”八.一”前夕,某中学举行国防知识竞赛:满分为100分,80分以上为优秀,现将高一的两个班参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、第二、第三、第四、第五小组的频率分别是0.3,0.4,0.15,0.1,0.050.040.030.0150.0100.00550607080901000 求:(1)成绩的众数、 中位数

文档评论(0)

SYWL2019 + 关注
官方认证
文档贡献者

权威、专业、丰富

认证主体四川尚阅网络信息科技有限公司
IP属地上海
统一社会信用代码/组织机构代码
91510100MA6716HC2Y

1亿VIP精品文档

相关文档