- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
07-第七节 不等概率抽样
第七章 不等概率抽样
7.1 概述
7.1.1 不等概率抽样的必要性及优点
在概率抽样中,简单随机抽样的一个基本特点是总体中的每一个单元的
入样概率都相等,因此它是一种等概率抽样。由于分层随机抽样中每一层内
的抽样也是按照简单随机抽样进行的,因此层内的抽样仍是等概率的。等概
率抽样的基本出发点是将总体 (或层)中的每一单元看作是平等的,不“偏
向”也不“疏远”某些特定的单元。如果总体单元的差异不是很大,这种处
理方法既是简单的,也是合理的。但是如果总体单元相差较大,也即总体方
差大的情况,等概率抽样的效果就不一定好。例如为了估计一个城市的商业
销售总额,对 商业网点进行调查。由于商业网点的规模差异极大,个别超
大型商场年销售额可以超过亿元,甚至达到几十亿;而为数较多的大中型商
场与商店年销售额是 几十万到几千万之间;至于数量更多的小型商店与摊
位的年销售额每个仅数万元或甚至不到一万元。 这种情况下,将大型、特
大型的商场与一般中小型市场或商店平等对待显然是不合理的。因为一个城
市中的大型商场数量虽少,但所占的市场份额则很高,对它们我们应该给予
更多的关注,对它们的调查应该调查得细一些,而对数量很大但所占市场份
额并不很大的小型商店则可粗一些,不需要化很大精力作过多的调查。对此
有几种处理方法,一种是将商业网点按规模 (资金总额或员工总数)大小分
成若干类,以类为层进行分层抽样:大型商场的抽样比可以高些,小型商店
的抽样比可以低些,绝少数特大型商场甚至可以进行100%抽样,即普查。
这种对少数大单元进行普查而对大多数小单元进行抽样的方法就是所谓的
目录抽样(list sampling )。另一种处理的思路则考虑得更细一点,即设想
抽样中将总体中每个单元的入样概率与其规模大小联系起来:大单元抽到的
概率大,小单元抽到的概率小,这就是不等概率抽样(sampling with unequal
probabilities )。在不等概率抽样中,每个单元都被赋予一个大小不等的入样
概率,而这个概率通常与某个辅助变量有关,例如前面例子中的表示单元规
模 (大小)的某种度量。
不等概率抽样通常用于以下两种情况。一是需要估计总体总量但总体单
元规模相差很大的情况。除了上面所举的例子外,还可以列举许多类似的例
子:为估计一个国家或地区城市人口总数 (以城市为单元),农作物总产量
(以农场为单元),工业总产值(以工厂为单元),交通运输量(以航空公司、
运输公司或港口为单元)等等。另一种情况是抽样审计,以项目或单笔帐作
为单元,每个单元被抽到的概率与其发生金额成正比,则可以抽查少量项目
1
或帐而所查样本发生金额可以达到总的发生金额很大比例的效果。不等概率
抽样另一常用的情况是由于种种原因不能直接对基本的较小单元抽样的情
形。例如 整群抽样或多阶抽样中,若初级单元大小 (用所包含的下一级单
元数目表示)相差很大,则常采用对初级单元的不等概率抽样。
不等概率抽样的主要优点是可以大大提高估计的精度,减少抽样误差。
而它的一个必要条件是对总体中的每一个单元,都要已知一个辅助量用以确
定其入样概率或两个单元同时入样的概率,这不仅 实施中是必需的,而且
数据处理中也是必要的。
7.1.2 不等概率抽样的主要分类
文献中研究的不等概率抽样有许多,例如布鲁尔 (Brewer )与哈尼夫
(Hanif ) 他们 1983 年出版的专著《不等概率抽样》中就列举了50 多种
方法。不过 正常用的也不过 10 种左右。 这些不等概率抽样方法中,按
其实施方法或特性可以分成许多不同的类型。
一种分类方法是按抽样过程中被抽到的单元是否被放回总体中去而分
为放回抽样与不放回抽样两类。事实上由于等概率抽样相对而言比较简单,
因此常用的是不放回情形,即通常意义下的简单随机抽样。而不放回的不等
概率抽样由于实施、目标量的估计及其方差估计通常都比较复杂,因此放回
的不等概率抽样也经常地被使用。在某种意义上可以这么说,抽样调查中的
放回抽样主要用于不等概率抽样这种特殊情形。采用放回抽样的主要好处
于在每次抽样中,所获得的样本是相互独立的,因此它的数据处理就特别简
单。而不放回抽样,虽然效率常常更高,但由于丧失了独立性,无论是抽样
文档评论(0)