- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分层三阶段及以上抽样的自加权抽样设计
侯志强刘喜波
(1 ?北方工业人学统计系、北京100041)
(2中国人民大学统计学院?北京100872)
摘要:大型抽样调查总是采用分层多阶段抽样 分层多阶段抽样若采用自加权的抽样设计?则总体总呈的
估计量形式简单,易于计算本文提出了分层三阶段及以上抽样的自加权抽样设计方法
矣键词:分层三阶段抽样:自加权抽样设计:PPS抽样
1仅对一级单元分层时的自加权三阶段抽样设计
设总体包含N个一级单元,划分为厶层,第/?层包含N”个一级单元,/?二1,2,…丄,易
知g h = N.第/?层第i个一级单元包含M加个二级单元第力层第,个一级单元内第丿?个 二级单元包含5个三级单元
“ h M hi设第一阶的样本量为几其中第
“ h M hi
(1)
即一级单元样木量按照各层所包含的三级单元数量在各层比例分配
在每个中选的一级单元内均抽収也个二级单元,在每个中选的二级单元内均抽収k个 三级单元
第一阶采用PPS抽样,辅助变量为各一级单元所包含的三级单元数量,即第〃层第i个 一级单元在一次抽取中的入样概率为
第二阶采用PPS抽样,辅助变量为各二级单元所包含的三级单元数量,即第力层第,个
一级单元内第/个二级单元在一次抽収中的入样概率为
-
第三阶采用放回或不放回的简单随机抽样
第力层第i个一级单元内第丿?个二级单元的总量估计为
rhij = £ 乙严“
其中,*讪为样本第h层第i个一级单元第丿个二级单元内第“个三级单元的观测值
第h层第i个一-级单元的总量估计为
第力层的总量估计为总体的总量估计为
第力层的总量估计为
总体的总量估计为
根据式(1)至式(7),易知
ivn k
⑷⑸⑹(7)⑻
⑷
⑸
⑹
(7)
⑻
2对前两级单元均进行分层时的自加权三阶段抽样设计
总体记号
设总体包含N个一级单元,划分为厶层,第力层包含N”个一级单元,力二1,2,…,厶,易 知?打=N.第〃层第,个一级单元包含个二级单元,划分为0加层,/?= 1,2,…,厶,i =1,2,…心 第力层第i个一级单元内第丿?层包含必坷个二级单元J二1,2,?“,0林,易知 ° hi
却砒=M詆第力层第,个一级单元内第丿?层的第r个二级单元包含Khijr个三级单元
样本记号
设第一阶抽样抽取?个一级单元,样本量n在各层间按照各层所包含的三级单元数量 比例分配,即第h层一级单元的样本量为
N h °hi M hij
在每个川选的一级单元内均抽取加个二级单元,二级单元样本量按照各层所包含的三 级单元数量在各层比例分配?即第//层第/个一级单元内第/层二级单元的样本量为
hijr
加 hij = m o卅( 1 °)
在每个中选的二级单元内均抽取左个三级单元
3)抽样方式
第一阶在各层抽取一级单元时采用PPS抽样,辅助变量为各一级单元所包含的三级单 元数量,即笫A层第/个一级单元在一次抽収屮的入样概率为
Zhi~ U Oh宀j ⑴)
yyyKhijr
第二阶在各层抽取二级单元时采用PPS抽样,辅助变量为各二级单元所包含的三级单
元数量,即第h层笫i个一级单元内第?/?层的笫厂个二级单元在一次抽収屮的入样概率为
hijr(12)
hijr
(12)
第三阶抽取三级单元时采用放回或不放回的简单随机抽样
4)总量估计
第〃层第,个一纽单亓内第i层的第r个一幼单亓的魚量估计为
(13)
(13)
其中,屮沪为样本笫“层第i个一级单元内第j层第厂个二级单元内第$个三级单元的观测
第h层第Z个一级单元内第/层所有二级单元的总量估计为
笫力层第i个一级单元的总量估计为第〃层所有一级单元的总量估计为(14)(15)(16)
笫力层第i个一级单元的总量估计为
第〃层所有一级单元的总量估计为
(14)
(15)
(16)
总体的总量估计为
根据式(9)至式(17),不难证明
Lh 、
Lh 、hi hij
tun k
式(18)说明,上述抽样设计是自加权的
3结束语
根据上述内容,不难证明下述的抽样设计是自加权的①在分层四阶段及以上抽样中 首先,将各阶的样本量确定为常数②,当对某一级单元分层时,将这一级单元的样本量按照 各层所包含的最终抽样单元数量在各层比例分配,然后,在前几阶采用PPS抽样,辅助变富 为各单元所包含的最终抽样单元数量,最后一阶采用放回或不放回的简单随机抽样
自加权的分层多阶段抽样设计要求最后一阶采用放回或不放回的简单随机抽样,而兰 参考文献:
I Kenneth Prcsv it(, Katharine G A brahitm? DcsignandM ethodok)gy[R ? Revised Versbn, M arch 2002, hltp: JJ www. census gov历odj2002pubs西63rv? pdf
Self-
原创力文档


文档评论(0)