- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 分层随机抽样;4.1 概述 ;4.1.2分层抽样的适用场合:
(1)不仅需要估计总体参数,也需要估计各层参数。
(2)便于管理,按现成的地理分布或行政划分来分层。
(3)希望样本中能包含各个部分,以增加代表性。
(4)把一个内部差异很大的总体分成几个内部比较相似的子总体(层)进行分层抽样,可以提高估计量的精度。如果有极端值,也可以把它们分离出来形成一层。
即“层间方差大,层内方差小”。
;4.2 简单估计量及其性质;一、分层抽样中
;例4.2:调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户分为4层,每层按简单随机抽样抽取10户,调查数据如下,估计该地区居民奶制品年消费总支出及估计的标准差。表:样本户奶制品年消费支出;解:;(3)该地区居民奶制品年消费总支出的置信度为95%的置信区间为
;例4.3:某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇居民23560户中随机抽取300户,在全部农村居民148420户中随机抽取250户,调查结果是城镇年平均户收入为15180元,标准差为2972元;农村年平均户收入为9856元,标准差为2546元。求全市年平均户收入的置信度为90%的置信区间。
解:;3、分层随机抽样中,总体比例P的简单估计
;估计的性质
(1)
(2)
;例:在某行业技术人员中,按年龄分层,调查会使用计算机者所占的比例。数据如下:
试估计总体中会计算机者占的比例。;解:;4.3 各层样本量的分配;1.比例分配:指按各层层权(各层单元数占总体单元数的比例)进行分配。;例:假设某公司欲估计某类产品的用户的每年平均支出。企划人员拟就整个潜在用户的名单,共8000户。
采用分层随机抽样抽取样本200户,求按比例分配时各层样本量。;例. 某电视台要在某地区的住户中,调查该台的晚间新闻的收视率。该地区包括3个县,共有67401家住户。假定该电视台采用分层随机抽样分别从三个县抽取住户,样本量为1500。每个县的总户数以及抽样数据列表如下:
?
求该地区新闻收视率的95%的置信区间。;解:分层随机抽样时,收视率P的估计为:
;收视率P的置信度为95%的近似置信区间为:
即有95%的把握可以认为,该地区的新闻收视率在22.1%~26.5%之间。
;2.最优分配:;
;例.在例4.3中,样本量仍为n=550。
城镇居民23560户,农村居民148420户。
城镇居民与农村居民的年收入的标准差分别为S1=3000元,S2=2500元。
对城镇居民与农村居民抽样平均每户的费用比为1:2,
试求城镇与农村两层比例分配与最优分配的样本量。
又若不考虑费用因素,那么最优分配的结果如何?;例3.2:调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户分为4层,每层按简单随机抽样抽取10户,调查数据如下,估计该地区居民奶制品年消费总支出及估计的标准差。表:样本户奶制品年消费支出;解:按比例分配时,
对于Neyman分配,;4.4 样本总量的确定;证明:;*
;例:某地区采用按比例分层随机抽样对养猪场的调查,根据养猪场的规模大小分为大、中、小三层。已知上次调查的资料如下:某地区采用按比例分层随机抽样对养猪场的调查,根据养猪场的规模大小分为大、中、小三层。已知上次调查的资料如下:
估计该地区生猪存栏总数的精度要求为以95%的置信度,相对误差为10%,试确定这次调查的总样本量以及各层样本量。 ;解:;例:某流水线生产了1500件产品,为估计产品的合格率,将产品按早、中、晚班分成三层。各班产量分别为:早班550件,中班500件,晚班450件。根据以往的情况,每班合格率均在95%左右。若要求以95%的把握使估计量的绝对误差不超过2%,分别确定按比例配置和按Neyman配置时总样本量和各层样本量。
解:;例: (续例3.2)如果要求在置信度95%下,相对误差不超过10%,则按比例分配和Neyman分配时,总样本量分别为多少?
解:;3.在估计总体均值时,若总费用给定,精度最高时,样本总量n的确定公式:
;4.5 分层时的若干问题;(2)最优分配(以Neyman为例)与比例分配在精度上的比较:
理论上讲,最优分配的精度应高于相同样本量的任何其他分配。
当然,也高于比例分配的精度。
但最优分配在精度上的改进有多大呢?
;*最优分配对于估计总体比例P的情形较少使用。
(除非P特别小或特别大)
;2.层的划分:
(1)层的划分原则:
a. 一种原则是仅为满足估计部分(即子总体)参数的需要
文档评论(0)