- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 抽样实务及问题
基本抽样方法是一种理想设计,实际抽样通常会与理想设计有一定的偏离。根据实际环境来设计抽样方案,正是抽样实务要解决的问题。本章首先介绍的是区域抽样方法,包括按户籍资料和按地图进行的区域抽样;然后介绍电话访问中的随机数字拨号技术;最后将讨论抽样中的非抽样误差问题,特别是针对流动人口的抽样提出一些解决方案。
第一节区域抽样
区域抽样是一种实用的抽样方法,它能为抽选居民住户提供很好的抽样方法。以往的常用区域抽样方法,通常是按户籍资料进行PPS抽样。而按居民居住地的地图进行的抽样,则是近年流行起来的一种区域抽样方法。下面将分别介绍这两种方法。
一、按户籍资料PPs抽样①
多阶段抽样能以多种形式实施,在实践中,分层多阶段区域抽样是应用范围比较广泛的多阶段抽样方法。只要能以区域划分总体,就能够采用多阶段区域抽样,例如,利用街区划分一个城市,利用各级行政单位划分一个国家。以下是一个按行政区划和户籍资料,利用PPS方法进行分层多阶段区域抽样的实例。假设某省一个调查研究中心计划进行一次全省范围的抽样调查,希望利用调查数据进行社会结构变迁研究。根据最近的普查,该省共有家庭,计划用PPS方法从中抽取4000户作为样本。步骤如下:
(一)计算总的抽样比
即在全省范围内从每4425户中抽取一户。
(二)确定各级抽样单位和计划样本规模
设此次抽样为4级抽样,各级抽样单位依次为:县(PSU)、乡、村、户。计划在全省共抽取40个县,每个县抽取2个乡,每个乡抽取2个村,每个村计划抽取25户,即a=40,b=2,c=2,d=25,b×C × d=100(每个县计划抽取l00户),由此产生类似表3—1的结果:
表3—1各级抽样单位计划抽取的数目
(三)对PSU分层和确定层内计划样本规模
由于全省社会经济发展水平由南至北逐渐下降,故结合各县的地理位置,由南至北将所有PSU划分为四个层。假设某一层的规模为l 935851户,采用按比例分配样本,因此层抽样比fb等于总抽样比f,层内计划样本规模可由fb=f求出:
①该实例的数据取自郭志刚、郝虹生等编著:《社会调查研究的量化方法》,l31~137页,北京,中国人民大学出版社,l989。
1935851×0.000226≈437.5(户)
不难看出,按此方式进行分层后,各层内子样本规模不一定是100的整数倍,即不同层的PSU内的子样本规模并不一定是完全相等的,而是大致为100户。在这种情况下,可取层内PSU数日ah值,使每个内子样本规模接近l00即可。这样在此层可取ah=4,则此层的每个PSU内计划子样本户数为109.4户,同样可以得出乡、村的子样本数目,由此产生类似表3—2的结果:
表3—2各级抽样单位计划抽取的户数
(四)在层内抽取PSU
第一,从普查资料或其他资料取得PSU的规模测量值Mha,将层内PSU排列起来。可采用以下方式排列PSU:一是在获得PSU的某个与调查变量相关的变量资料的基础上,将PSU按该变量值排序,以取得隐含分层效果,例如,将各PSU按各个县的人均收入值大小进行排列。另一种方式是在地图上将各个 PSU用一条蛇形线串起来,然后将各个PSU按此线穿过的先后顺序排列,这样可以使样本PSU在空间上较为分散,参见表3—3第二列。
第二,按层内PSU的排列顺序,将规模测量值Mha累加,参见下表第三列
第三,采用系统抽样,先计算抽样间距
在此例中,
(k很大,故四舍五入影响不大)
然后,在1~k范围内抽取一个随机数r作为起点,设从随机数表中查得一个8位数则r=268042.92。最后,抽出ah个PSU,抽中号码分别为:
r,r+k,…,r+(ah-l)k
在此例中,抽中的号码分别为:268042.92,752005.67,1235968.42,1719931.17。这4个号码分别落在第2、5、7、10号PSU的号码范围,因此这四个县被抽中,由此产生类似表3—3的结果:
慕峁?
表3—3 PPS方法抽取PSU(县)
(五)在PSU内抽次级抽样单位
第二、第三级抽样分别用PPS方法,从每个样本县中抽选出b一2个样本乡,从每个样本乡中抽选出c=2个样本村,抽取方法与上述抽取PSU的步骤类似,不再赘述。
第四级抽样,从每个样本村内抽取样本户。计划样本户数为d“,这里 d*=27.35(户)。这样,第四级抽样的抽样比为d*/Mhaβγ,其中Mhaβγ为第a县内第β乡的第γ村的规模测量值。第四级抽样的期望样本户数由该抽样比乘实际村规模(户数)得到,即d=(d*/Mhaβγ)×Nhaβγ。设某样本村的规模测量值为Mhaβγ=374(户),而调查时的实际规模测量值Nhaβγ=397(户),则从该村
实际应抽户数为
(户)。抽户可按线性系统抽样进
行,即先算出抽样间距
文档评论(0)