111用样本数字特征估计总体数字特征.pptVIP

111用样本数字特征估计总体数字特征.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用样本的数字特征 估计总体的数字特征 求下面这组数据的众数、中位数、平均数 众数为6 中位数为6 思考:频率分布直方图中估计的众数与原始数据中的众数2.3不同,为什么? 如何从频率分布直方图中估计中位数? 思考:2.02这个中位数的估计值,与样本数据的中位数2.0不同,为什么? 如何从频率分布直方图中估计平均数 ? 思考:平均数估计总体情况有什么优缺点? * Youyou课堂 Http:// 1.初中学过的众数、中位数、平均数,其定义分别是 (1)在一组数据中______________的数据叫做这组数据的众数. 出现次数最多 最中间位置 平均数 4、4、4、6、6、6、6、8、8、8 练习 1.甲在一次射击比赛中的得分如下: ( 单位:环).7,8,6,8,6,5,9,10,7,5,则他命中的平均数是_____. 众数是 中位数是 2.某次数学试卷得分抽样中得到:90分的有3个人,80分的有10人,70分的有5人,60分的有2人,则这次抽样的平均分为_______. 7.1 77分 5,6, 7,8 7 1.众数、中位数、平均数与频率分布直方图的关系 (1)众数在样本数据的频率分布直方图中,就是最高矩形的中点的____________. (2)在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该_________,由此可以估计中位数的值. 横坐标 相等 (3)平均数是频率分布直方图的“重心”.等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 月均用水量 / t 频率 / 组距 o 4 . 5 4 3 . 5 3 2 . 5 2 1 . 5 1 0 . 5 0 . 50 0 . 40 0 . 30 0 . 20 0 . 10 如何从频率分布直方图中估计众数?如图: 2.25 众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。 在频率分布直方图,我们只能直观地看出数据的大概分布情况,从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。 讨论:众数估计总体情况有什么优缺点? 能够体现样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。 0 . 02 0 . 04 0 . 06 0 . 14 0 . 25 0 . 22 0 . 15 0 . 08 0 . 04 月均用水量 / t 频率 / 组距 o 4 . 5 4 3 . 5 3 2 . 5 2 1 . 5 1 0 . 5 0 . 50 0 . 40 0 . 30 0 . 20 0 . 10 前四个小矩形的面积和=0.49 2.02 后四个小矩形的面积和=0.26 分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积相等。 总结:在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标称为中位数。 注:图中的数据是小矩形的面积即频率 上图中,设中位数为x,则 从频率分布直方图本身得不出原始的数据内容,频率分布直方图已经损失一些样本信息。 思考:中位数不受少数极端值的影响,这在某些情 况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗? 考察100位居民的月均用水量表中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中人为操作的失误经常造成错误数据。 对极端值不敏感有利的例子: 某人具有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感。这里更好的方法是同时用平均数和中位数来作为参考指标,选择平均数较大且中位数较大的公司就业。 对极端值不敏感有弊的例子: 注:图中的数据是小矩形的面积即频率 0 . 02 0 . 04 0 . 06 0 . 14 0 . 25 0 . 22 0 . 15 0 . 08 0 . 04 月均用水量 / t 频率 / 组距 o 4 . 5 4 3 . 5 3 2 . 5 2 1 . 5 1 0 . 5 0 . 50 0 . 40 0 . 30 0 . 20 0 . 10 . . . . . . . . 0.25 0.75 1.25 1.75 2.25

文档评论(0)

ranfand + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档