- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
8.1 概述 1.二阶抽样定义: 设总体由N个初级单元组成,每个初级单元又由若干次级单元组成,若在总体中按一定方法抽取n个初级单元,对每个被抽中的初级单元再抽取若干次级单元进行调查,这种抽样称为二阶抽样。 2.二阶抽样与分层抽样、整群抽样的关系: 如果第一阶段抽样采用全面调查,二阶抽样就成了分层抽样; 如果第二阶段抽样采用全面调查,二阶抽样就成了整群抽样。 8.2 初级单元大小相等时的二阶抽样 9.2.1总体均值的估计量: 假定总体由N个初级单元组成,每个初级单元都含有M个次级单元。 从N个初级单元中按简单随机抽样抽取n个初级单元, 在每个被抽中的初级单元中按简单随机抽样抽取m个次级单元。 定理:若两阶段的抽样都是简单随机抽样的,则 证明: 证明: 证明: 例:文具商店一柜台,上月共用了18本发票,每本发票含发票200张。查帐者随机挑选了4本发票,再在挑中的发票本中随机抽了40张发票,记录其营业额。数据整理如下: 估计该柜台上个月的营业总额及标准差。 解: 8.3 初级单元大小不等时的二阶抽样 8.3.1 对初级单元进行简单随机抽样时,总体总和Y的估计 第一阶抽样按简单随机抽样从N个初级单元中抽取n个, 第二阶抽样按简单随机抽样,在抽中的初级单元中分别独立抽取次级单元。 (1)简单估计: 证明: 证明: (2)比估计: 8.3.2 对初级单元进行放回不等概率抽样时,总体总和Y的估计 第一阶抽样按放回不等概率抽样(多项抽样)抽取初级单元, 第二阶抽样并没有作出特别的规定,只要初级单元指标Yi的估计 是无偏的. 自加权情形: 第一阶抽样按放回不等概率抽样抽取初级单元, 第二阶抽样都抽取m个。 自加权情形: 第一阶抽样按PPS抽样抽取初级单元, 第二阶抽样按简单随机抽样抽取次级单元,都抽取m个。 实际工作中,对于各级单元大小不相等时多阶抽样,自加权通常的做法是: 除了最后一阶采用等概率抽样(放回的或不放回的均可),前几阶均采用PPS抽样,并且自第二阶开始,每一阶的样本量都相同(即mi=m,kj=k,…),则样本是自加权的,其估计量的形式非常简单。 总体总和的估计为 的方差估计为 8.4 样本量的确定 一、初级单元大小相等时,最优样本量m与n的确定: (1)m的确定: 线性费用函数: 二、各级单元大小不相等时,多阶抽样的总样本量及最优样本量的配置 二阶自加权情形: 第一阶抽样按PPS抽样抽取初级单元, 第二阶抽样按简单随机抽样抽取次级单元,都抽取m个。 实际工作中,对于各级单元大小不相等时多阶抽样,自加权通常的做法是: 除了最后一阶采用等概率抽样(放回的或不放回的均可),前几阶均采用PPS抽样,并且自第二阶开始,每一阶的样本量都相同(即mi=m,kj=k,…),则样本是自加权的,其估计量的形式非常简单。 总体总和的估计为 的方差估计为 这时,多阶抽样的总样本量可以这样确定: 1.根据简单随机抽样时应抽样本量 2.再乘以设计效应deff获得。 多阶抽样与简单随机抽样相比其效率比较低,deff应该大于1。实际工作中,可取deff的经验数据。不同项目的deff不同。 例: 某调查公司接受了一项关于全国城市成年居民人均奶制品消费支出及每天至少喝一杯鲜奶的人数的比例情况的调查。确定抽样范围为全国地级及以上城市中的成年居民。成年居民指年满18周岁以上的居民。 第一步:确定抽样方法。 调查公司决定采用多阶抽样方法进行方案设计,调查的最小单元为成年居民。确定调查的各个阶为城市、街道、居委会、居民户,在居民户中利用二维随机表(Kish随机表的简化)抽取成年居民。 第二步:确定样本量及各阶样本量的配置。 按简单随机抽样时,在95%置信度下,绝对误差为5%,取使方差达到最大时的消费奶制品的居民比例为50%,则全国样本量应为: 根据以往调查的经验,估计回答率b=80%,因此调整样本量为: 多阶抽样的效率比简单随机抽样的效率低,这里取设计效应deff=3.2,则在全国范围内应调查的样本居民为: 各阶的样本量配置为: 初级单元:20个城市; 二级单元:每个样本市内抽4个街道,共80个街道; 三级单元:每个样本街道内抽2个居委会,共160个居委会; 四级单元:每个样本居委会内抽10个居民户,1 600个居民户。
文档评论(0)