- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分层三阶段及以上抽样的自加权抽样设计
分层三阶段及以上抽样的自加权抽样设计
侯志强1, 2 ,
刘喜波1
( 1. 北方工业大学 统计系, 北京 100041)
( 2. 中国人民大学 统计学院, 北京 100872)
摘要: 大型抽样调查总是采用分层多阶段抽样. 分层多阶段抽样若采用自加权的抽样设计, 则总体总量的
估计量形式简单, 易于计算. 本文提出了分层三阶段及以上抽样的自加权抽样设计方法.
关键词: 分层三阶段抽样; 自加权抽样设计; P P S 抽样
1 仅对一级单元分层时的自加权三阶段抽样设计
设总体包含N 个一级单元, 划分为L 层, 第 h 层包含N h 个一级单元, h = 1, 2, ?, L , 易
L
知∑N h = N . 第 h 层第 i 个一级单元包含M h i 个二级单元. 第 h 层第 i 个一级单元内第 j 个
h = 1
二级单元包含 K h i j 个三级单元.
设第一阶的样本量为 n , 其中第 h 层的样本量为
N h
M h i
∑∑K h ij
i= 1 j = 1
n h =
(1)
n
N M
L h h i
∑∑∑K h i j
h = 1 i= 1 j = 1
即一级单元样本量按照各层所包含的三级单元数量在各层比例分配.
在每个中选的一级单元内均抽取 m 个二级单元, 在每个中选的二级单元内均抽取 k 个 三级单元.
第一阶采用 P P S 抽样, 辅助变量为各一级单元所包含的三级单元数量, 即第 h 层第 i 个
一级单元在一次抽取中的入样概率为
M h i
∑K h ij
j = 1
Z h i =
(2)
N M
h h i
∑∑K h i j
i= 1 j = 1
第二阶采用 P P S 抽样, 辅助变量为各二级单元所包含的三级单元数量, 即第 h 层第 i 个
一级单元内第 j 个 二级单元在一次抽取中的入样概率为
K h i j
(3)
Z h i j =
M
h i
∑K h i j
j = 1
第三阶采用放回或不放回的简单随机抽样.
第 h 层第 i 个一级单元内第 j 个二级单元的总量估计为
k
K h i j
Yδ
h ij = ∑y h ij u
(4)
k
u = 1
其中, y h i j u 为样本第 h 层第 i 个一级单元第 j 个二级单元内第 u 个三级单元的观测值.
第 h 层第 i 个一级单元的总量估计为
δ
m
Yδ
1
Y h i j
m ∑ z
h i =
( )
5
h i j
j = 1
第 h 层的总量估计为
δ
nh
1 Y h i
Yδ
∑ z
(6)
h =
n
h i= 1
h i
总体的总量估计为
L
Yδ =
∑Yδ
(7)
h
h = 1
根据式 (1) 至式 (7) , 易知
N h
M h i
L
∑∑∑K h ij
nh
L
m
k
Yδ =
h = 1 i= 1 j = 1
∑∑∑∑y
( )
8
h i j u
nm k
h = 1 i= 1 j = 1 u = 1
式 (8) 说明, 上述抽样设计是自加权的.
2 对前两级单元均进行分层时的自加权三阶段抽样设计
1) 总体记号
设总体包含 N 个一级单元, 划分为L 层, 第 h 层包含N h 个一级单元, h = 1, 2, ?, L , 易
L
知∑N h = N . 第 h 层第 i 个一级单元包含M h i 个二级单元, 划分为 O h i 层, h = 1, 2, ?, L , i
h = 1
1, 2, ?N h. 第 h 层第 i 个一级单元内第 j 层包含M h ij 个二级单元, j = 1, 2, ?, O h i , 易知
=
O h i
∑M h i j = M h i. 第 h 层第 i 个一级单元内第 j 层的第 r 个二级单元包含 K h ij r 个三级单元.
j = 1
2) 样本记号
设第一阶抽样抽取 n 个一级单元, 样本量 n 在各层间按照各层所包含的三级单元数量 比例分配, 即第 h 层一级单元的样本量为
N h
O h i M h i j
∑∑∑K h ij r
i= 1 j = 1 r= 1
(9)
n h = n
N O M
L
h h i h ij
∑∑∑∑K h i j r
h = 1 i= 1 j = 1 r= 1
在每个中选的一级单元内均抽取 m 个二级单元, 二级单元样本量按照各层所包含的三
级
文档评论(0)