- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PPS抽样
第六章 不等概率抽样
第一节 等概率抽样概述
一、不等概率抽样的必要性
在简单随机抽样中,总体(或层)中的每个单元入样的概率都相等。但是在许多实际问题中,我们还需要使用不等概率抽样。一种情况是调查的总体单元与抽样总体的单元可能不一致; 另一种需要用到不等概率抽样的情况是,抽样单元在总体中所占的地位不一致;第三种需用不等概率抽样的情况是为了改善估计量的特性。
二、不等概率抽样的主要分类
不等概率抽样可按多种原则进行分类。
放回抽样与不放回抽样。
对于不放回抽样,按其样本单元抽取方式的不同又可分为:逐个抽取法;重抽法;系统抽取法;全样本方法。
三、不等概率抽样的特点
不等概率抽样的主要优点是由于使用了辅助信息,提高了抽样策略的统计效率,与简单随机抽样甚至与分层抽样相比,能显著地减少抽样误差。
不等概率抽样有以下的缺点:抽样框中的所有单元,都要有高质量的、能用作大小度量的辅助信息;抽样框的创建比简单随机抽样和系统抽样成本高,更复杂,因为需要度量和存储总体中每一个单元的大小;并非在任何情况下都能使用,因为并不是每一个总体都有稳定且与主要调查变量相关的有关大小或规模的度量;抽样及估计(特别对不放回抽样)相当复杂; 当单元大小度量不准确或不稳定时不适用,此时更好的办法是将单元按大小分组并使用分层抽样。
第二节 放回不等概率抽样
一、多项抽样
多项抽样是一种最简单的不等概率抽样。它是从容量为N的总体中有放回地进行独立抽样,每次抽样中,使抽到第i个单元的概率为Zi,i=1,2,…,N,,连续抽n次,从而抽到n个单元。
若记为总体中第i个单元在n次抽样中被抽到的次数,显然对每个i都有:,且。作为随机变量(,,…,),它的联合分布即是以下的多项分布:
这就是多项抽样这个术语的来源。
二、PPS抽样的涵义
PPS抽样是与大小(或规模)成比例的概率抽样,是一种使用辅助信息从而使入样概率不相等的抽样技术。
如果总体单元的大小或规模变化很大,且这些大小是已知的,这样的信息就可以用在抽样中,以提高统计效率。如果单元大小的度量是准确的,而且所研究的变量与单元的大小相关,PPS抽样能极大地提高精度。但如果大小的度量不大准确,最好按大小分组并使用分层抽样。
PPS抽样的入样概率
为第i个单元的入样概率,其中是总体中所有单元的“大小”之和,为第i个单元的大小。
PPS抽样的一个很好的例子是商业调查,单元大小度量可用雇员数、年销售额、经营场所数等,但这些变量在不同年份发生变化的可能性要大一些。再如农产量调查中单元大小可以用面积进行度量,对于大多数农户,其土地面积在各个年份都是常量。
三、多项抽样的实施方法
1.代码法
设不太大,且(或)为第i单元大小的度量,且为整数,对总体中的每个单元计算累计大小,得到总体所有单元代码的累计和,对总体中每个单元确定与它相对应的代码范围;在1到总的累计大小范围内抽取一个随机数,该随机数相应的代码范围中的单元即为入样单元。重复上述步骤,直到抽得n个单元为止。
抽样时,单元的代码如下表:
单元 单元的大小 累计 代 码 2.拉希里法
令每次抽取一个范围内的随机数及范围内的随机数,若,则第单元入样;否则,重抽。此时,第i个单元的入样概率与成正比,从而。重复这一过程,直到抽够所需的个单元。
3.系统PPS抽样方法
对总体中的每个单元,计算累计大小;对总体中每个单元确定与它相对应的代码范围;确定抽样间隔k=总累计大小/n;在1和k的范围内确定一个随机起点r;与代码r,r+k,r+2k,…,r+(n-1)k所在范围相对应的单元入样。
4.随机系统抽样法
在这种方法中,名录在系统抽样前要进行随机排序。如果完全按原来的排序,会把一些可能的样本排除在外。在上面介绍的系统抽样的例子中,不可能把单元3很抽入同一个样本。把名录重新随机排列后会增加潜在的可能抽到的样本数量。
四、汉森—赫维茨估计量及其性质
总体总和Y的无偏估计量如下:
且
若n〉1,则的无偏估计量为
对于PPS抽样,,所以有
其中是第i个样本单元的观测值,是该单元的大小。
第三节 放回不等概率抽样
一、包含概率与πPS抽样
在不放回抽样中,每个单元被包含到样本的概率也即入样概率及任意两个单元都包含到样本的概率都起着十分重要的作用,它们通称为包含概率。
对于固定的n包含概率满足以下性质:
(1)
(2)
(3)
与放回的PPS抽样类似,对于不放回不等概率抽样,我们最感兴趣的是与单元大小成比例的情形。若仍记,则由性质1有:
以后我们将这种不放回的与单元大小成比例的概率抽样称为πPS抽样。
严格的πPS抽样实施起来非常复杂。事实上,只有当n=2时,才有一些简单且实用的方法。
二、霍维茨—汤普森估计量及其性质
对不放回的不等概率抽样,总体总和Y的估计采用霍维茨(Horvitz
文档评论(0)