- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 用样本估计总体 前面我们研究了通过抽样来收集数据和整理数据的方法,数据被收集后,必须从中寻找所包含的讯息,以便我们能通过样本来估计总体。 样本的特征直接反映了总体的特征,我们通常用样本的频率和数字特征来评估总体的特征。 复习回顾 主要内容 用样本的频率分布估计总体分布 用样本的数字特征估计总体的数字特征 用样本的频率分布估计总体分布 【探究】我国是世界上严重缺水的国家之一,城市缺水问题较为突出。某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费,如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做那些工作? 很明显,如果水价太高,影响居民日常生活,水价太低,不利于节约用水. 为了确定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等等. 由于城市住户较多,因此我们采用抽查的方式进行,下面是对100户进行抽查的结果: 这100户用水量在0.2~4.3之间,除此之外,我们很难得到其他信息,一次我们必须对数据的潜在信息进行分析 下面我们将要学习到的是频率分布表和频率分布图 从比例的角度来分析数据 频率分布的基本步骤是: 1.求极差: 最大数与最小数的差,反映了数据的变化范围 4.3-0.2=4.1 2.决定组距和组数 组距和组数没有固定的标准,常常需要尝试和选择的过程,一般数据较少(100以内)时,分成5~12组 3.数据分组: 数据的分组也不是越多越好,为了方便,我们力求“取整” 因此,分成9组较合适 以0.5为组距分组时。可以分成9组: [0,0.5),[0.5,1.0),…,[4,4.5) 4.列频率分布表 利用 计算出各组数据的频率 5.作频率分布直方图 频率分布直方图就是以面积的形式反映了数据落在 各个小组的频率的大小,所有小长方形的面积和为1 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O (1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的; (2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少; (3)居民月均用水量的分布有一定的对称性等. 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 频率分布直方图的特征: (1)从频率分布直方图可以清楚的看出数据分布的总体趋势; (2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。 如右图,我们连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. 一般的,随着样本容量的增加,作图时组数也相应的变大,相应的频率分布折线图会越来越接近一条光滑曲线——总体密度曲线. 总体密度曲线反映了总体在各个范围内取值的百分比,它比频率分布直方图提供更加精细的信息。 例如:图中阴影部分的面积就表示总体在[a ,b]内的百分比。 注意点:由于样本是随机的,不同的样本得到的频率分布折线图不同;即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,频率分布折线图是随着样本的容量和分组情况的变化而变化的,因此不能由样本的频率分布折线图得到准确的总体密度曲线。 用样本的数字特征估计总体的数字特征 频率分布直方图和频率分布折线图虽然能够很好的反映总体的分布情况,但为了更好的把握总体,我们还需要通过样本的数据对总体的数字特征进行研究。 知识探究(一):众数、中位数和平均数 思考1:我们学过众数、中位数和平均数的概念,这些数据都是反映样本信息的数字特征,对一组样本数据如何求众数、中位数和平均数? 思考2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么? 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 思考3:在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系? 取最高矩形下端中点的横坐标2.25作为众数. 思考4:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么? 月均用水量/t 频率 组距 0.
文档评论(0)