- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章分层随机抽样1.ppt
4.1 概述 4.1.1分层抽样(stratified sampling)、分层随机抽样(stratified random sampling): 分层抽样:将容量为N的总体分成L个不相重叠的子总体,子总体的大小分别为N1、 N2、… NL,皆已知,且 每个子总体就称为层。从每层中独立地进行抽样,这样的抽样方法称为分层抽样。 分层随机抽样:在分层抽样中,如果每层中的抽样都是简单随机抽样,则这样的分层抽样称为分层随机抽样。 4.1.2分层抽样的适用场合: (1)不仅需要估计总体参数,也需要估计各层参数。 (2)便于管理,按现成的地理分布或行政划分来分层。 (3)希望样本中能包含各个部分,以增加代表性。 (4)把一个内部差异很大的总体分成几个内部比较相似的子总体(层)进行分层抽样,可以提高估计量的精度。如果有极端值,也可以把它们分离出来形成一层。 即“层间方差大,层内方差小”。 4.2 简单估计量及其性质 对总体均值或总值的估计: 一、分层抽样中 例4.2:调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户分为4层,每层按简单随机抽样抽取10户,调查数据如下,估计该地区居民奶制品年消费总支出及估计的标准差。表:样本户奶制品年消费支出 解: (3)该地区居民奶制品年消费总支出的置信度为95%的置信区间为 例4.3:某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇居民23560户中随机抽取300户,在全部农村居民148420户中随机抽取250户,调查结果是城镇年平均户收入为15180元,标准差为2972元;农村年平均户收入为9856元,标准差为2546元。求全市年平均户收入的置信度为90%的置信区间。 解: 3、分层随机抽样中,总体比例P的简单估计 估计的性质 (1) (2) 例:在某行业技术人员中,按年龄分层,调查会使用计算机者所占的比例。数据如下: 试估计总体中会计算机者占的比例。 解: 4.3 各层样本量的分配 在分层随机抽样中,假设样本量n固定 1.比例分配:指按各层层权(各层单元数占总体单元数的比例)进行分配。 例:假设某公司欲估计某类产品的用户的每年平均支出。企划人员拟就整个潜在用户的名单,共8000户。 采用分层随机抽样抽取样本200户,求按比例分配时各层样本量。 例. 某电视台要在某地区的住户中,调查该台的晚间新闻的收视率。该地区包括3个县,共有67401家住户。假定该电视台采用等比例分层随机抽样分别从三个县抽取住户,样本量为1500。每个县的总户数以及抽样数据列表如下: ? 求该地区新闻收视率的95%的置信区间。 解:分层随机抽样时,收视率P的估计为: 收视率P的置信度为95%的近似置信区间为: 即有95%的把握可以认为,该地区的新闻收视率在22.1%~26.5%之间。 2.最优分配: 例.在例4.3中,样本量仍为n=550。 城镇居民23560户,农村居民148420户。 城镇居民与农村居民的年收入的标准差分别为S1=3000元,S2=2500元。 对城镇居民与农村居民抽样平均每户的费用比为1:2, 试求城镇与农村两层比例分配与最优分配的样本量。 又若不考虑费用因素,那么最优分配的结果如何? 例3.2:调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户分为4层,每层按简单随机抽样抽取10户,调查数据如下,估计该地区居民奶制品年消费总支出及估计的标准差。表:样本户奶制品年消费支出 解:按比例分配时, 对于Neyman分配, 例:在例3.3中,样本量仍为n=550,城镇居民与农村居民年收入的标准差估计分别为3000元和2500元,对城镇居民与农村居民抽样品均每户的费用比为1:2,试求(1)城镇与农村两层比例分配样本量;(2)最优分配的样本量。 解: (1)按比例分配时, (2)对于Neyman分配, 4.4 样本总量的确定 1.在分层随机抽样中,影响样本总量n的因素: (1)只讨论对总体参数的精度要求; (2)样本量的分配形式。 2.在估计总体均值时,若精度要求给定,样本总量n的确定公式: 证明: * 例:某流水线生产了1500件产品,为估计产品的合格率,将产品按早、中、晚班分成三层。各班产量分别为:早班
文档评论(0)