《第五章(不等概抽样)》.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章(不等概抽样);一、不等概抽样简介 二、放回不等概抽样 三、不放回不等概抽样;一、不等概抽样简介; 迄今为止,我们所讨论的两种抽样方法——简单随机抽样和分层抽样具有一个共同的特点:总体或层中每个单元入样的可能性(概率)相等——等概率抽样(sampling with equal probabilities) 。等概率抽样的基本出发点是:将总体或层中每一个单元看作是平等的,不“偏向”也不“疏远”某些特定的单元如果总体单元的差异不大,这种处理方法既公正又方便。但在许多社会经济活动中并非所有单元的地位都相同或相近,即总体单元相差较大,也即总体方差大,这时等概率抽样的效果就不一定好。; 例如,为了估计一个城市的商业销售总额,对各商业网点进行调查。由于商业网点的规模差异极大,个别超大型商场年销售额可以超过亿元,甚至达到十几亿,它们是否景气对这个城市的商业销售总额起着至关重要的作用;而为数较多的大中型商场与商店年销售额是在几十万到几千万之间;至于数量更多的小型商店与摊位的年销售额仅数万元甚至不到一万元。在这种情况下,将特大型、大型商场与一般中小型市场或商店平等对待既不公允,又使抽样推断结果有较大可能发生大的偏倚。因此,在调查中,对大型商场应该处于更重要的位置。; 这个例子启示我们:当总体单元相差较大,用等概率抽样的方法不合理时,可在抽样中将总体中每个单元的入样概率与其规模大小联系起来:“大”单元入样的概率大,“小”单元入样的概率小,这就是不等概率抽样(sampling with unequal probabilities)。 出现总体单元差异特别大时,往往是牺牲“简单”来提高抽样效率,一种做法是将总体按规模分层,然后,对较大单元的层取的抽样比高些,抽样比可以是100%,而较小单元的层抽样比定的小些。另一种就是赋予每个单元与其规模(或辅助变量)成比例的入样概率,这样,大单元入样概率大,小概率入样概率小。; 不等概抽样中,总体中某类单元比其他单元出现在 样本的机会大,这给人感觉这部分单元对推算影响大, 使得推算偏向某一方。例如,大商场抽的多了,会不会 造成推算的销售额偏大呢? 实际上 ,某些单元的入样概率大,推算时,则赋 予它较小的权,反之,入样概率小,推算时,就赋予它 较大的权,这样就可以使推算结果仍然是公平的。 ;3、不等概抽样的应用;4、不等概抽样的优点和条件; 不等概率抽样分为放回与不放回两种情况,我们最关 心也是最重要的情形是抽样容量n固定时,单元的入样 概率(不放回抽样)或每次抽样的概率(放回抽样)与 单元的“大小”严格成比例情形。这种情形下的放回 抽样称为pps抽样,不放回抽样称为 抽样。 放回不等概抽样:每次抽样过程都是从同一个总体中独立 进行的,因此实施及推算过程相对简单一些。 不放回不等概抽样:在抽取时效率要高些。;二、 放回的不等概率抽样; 1、 多项抽样; 若记 为总体中第i单元在n次抽样中被抽中的次数,显然对每个i都有: 且 则 是一个随机向量(r.v.),其联合分布为: ;2、 pps抽样及实施方法; 多项抽样是最简单的不等概率抽样,它的实施方法通常有两种,以pps抽样为例。;(1)代码法——也称汉森—赫维茨(Hansen-Hurwitz)法 ;表5.1.1 pps抽样时各单元的代码数(设Mi皆为整数);例1 设某个总体有N=10个单元,欲用多项抽样从中抽取n=5个单元,给定的入样概{Zi}如下表所示。; i ; 在[1,100]范围内产生5个随机数,设分别为04,73,25,49,82,则第1,第6,第3,第5及第8个单元入样。如再增加一个样本单元,产生的随机数为58,则又对应第5个单元,这个单元即为抽中两次。由于单元愈大,被赋予的代码数就愈多,因此每个单元入样的概率与其大小Mi成正比。;(2)拉希里(Lahiri)法——也称为二次抽取法; i ;例如,在例1中,N=10,M*=24。设[1,10]中的一个随机数为4,[1,24] 中的一个随机数为9,由于M4=69,因此需要重抽。设第二次抽到的一组随机数为(7,15),则仍然不满足要求,还需要重抽。若再次抽到的一组随机数为(2,8),则由于M2=108,故第二个单元入样。如此重复,直到抽到n个单元(允许重复)为止。; 显然,第i个单元的入样与否受到m的影响,只有 时它才入样,因此第i个单元入样的可能性与Mi的大小成正比.事实上:;3、汉森—赫维茨 (Hansen-Hurwitz)估计量; 以盒子模型来描述,我们的盒

文档评论(0)

tangtianbao3 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档