- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分层随机抽样
数据处理——分层随机抽样
研究数据总体取自世界214个国家及地区10年间(2002至2021)的年度数据报告①,总体数量较大,条目繁多,指标横向差距明显;因此,在保证研究成果真实有效的前提下,我们采用分层随机抽样技术进行抽样,以期减少工作量,降低研究成本。
结合数据特征,按照国际标准以“各国及地区人均年收入的高低”为依据,可以将数据分为——High income: nonOECD、High income: OECD、Upper middle income、Lower middle income、Low income共五层,分别记为1、2、3、4、5。由于数据来自世界银行网站,较为完整,各层抽样费用均可记为单位1,故可采用奈曼分配原则②确定样本总量n和各层样本量nh,具体方法如下:
针对总体均值 Y,要求 y 在α=0.05的条件下绝对误差限d=6000,则根据st奈曼分配原则有公式
( hWhSh)^2 hWh(Sh^2)
V+、nh=n?
、V=d^2 u^2
通过计算得出下表:
表1 各国及地区人均GDP调查样本总量和各层样本量的计算③
则在显著性水平α=0.05下,有
V=d^2 u^2==9371095.38 1.96α
hWhSh 2V+ hWh(Sh^2)
20310.702
9371095.38+
?470328333.78
W1S11984.98 n1=n?=36?≈4
hhhW2S24944.22
n2=n?=36?≈9
W3S35736.66
n3=n?=36?≈10
hhhW4S43398.59
n4=n?=36?≈6
hhhW5S54246.25
n5=n?=36?≈7
可以确定:样本总量为36个,各层样本量分别为High income: nonOECD 3个、High income: OECD 9个、Low income 10个、Lower middle income 6个、Upper middle income 8个。根据以上结果,我们对214个国家及地区进行分层随机抽样,抽样结果如下:
表2 抽样结果
①由于一些国家及地区相关数据全部或者部分缺失,没有研究的意义,这类个体在最开始就已被剔除,所以数据总体取自214个世界国家及地区,而不是世界全体国家及地区。
②奈曼分配原则是分层随机抽样技术中最优分配方式的一个特例,前提是各层抽样费用都相等,一般记为单位1,此时可根据公式 n=
V+( hWhSh)^2
hWh(Sh^2)
hWhSh 、V=d^2 u^2 解出样本总量n及各层样
本量nh,其中h为各层编号,N为数据总量,Wh为各层层权(即Nh/N),Sh^2、Sh为各层方差和标准差,V为给定的估计量 y 方差的上限。 st
③表中结果均根据214个世界国家及地区2021年的人均GDP数值计算得出。 employers, female unemployment, female
wage and salary workers,female
文档评论(0)