- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[2018年最新整理]不等概率抽样
不等概率抽样
引例: O’Brien et al. (1995) 对Philadelphia地区的病人进行抽样, 目的是了解病人对于医疗服务的偏好。目标总体是这一区域的所有注册的医院的病人。总共有294家医院,27652个床位(抽样以前,研究人员只知道床位数,不知道病人数)。
等概率的抽取样本医院的缺点?
首先,可能医院中愿意接受CPR治疗的病人数量会正比与医院床位的数量,采用等概率简单估计量可能会有大的方差。
其次,自加权的等概率样本可能难于管理。可能仅仅为了调查一两个病人就需要去一家医院,并且合理分配调查人员的工作负担也是比较困难的。
第三,调查成本在调查开始的时候是未知的,一个40个医院的样本可能包括了主要的大的医院,这会导致比预计更大的成本。
其他办法?
1、调查人员还可以采用与医院病床数量成比例的方法抽取57个医院,然后从每个样本医院中抽取30个简单随机样本床位。
2、如果病人数等于床位数,并且医院实际的床位数和抽样时依据的病床数据一致,每个病人是否有相同的入样概率?
3、而且成本在调查实施前是已知的,因为每个访员在每个医院访问的病人数量是相同的。而且,总体总量的方差可能更小。
4、分层抽样:抽样选择概率小的单位会有较高的权数。
5、采用不等概率抽样来减少抽样方差而不采用清晰的分层。采用不同的概率来选择初级样本单元,并且在估计中采用不同的权数来进行弥补。
抽样的关键是每个样本的选择概率是已知的。
一、不等概率抽样适用情况
第一,抽样单元在总体中所占的地位不一致。第二,调查的总体单元与抽样总体的单元不一致。第三,改善估计量。不等概率抽样的优点主要是大大提高了估计精度,减少抽样误差,但使用它也由条件,就是必须要有说明每个单元规模大小的辅助变量来确定每个单元入样的概率,这在抽样设计及估计时都是必须得。
二、不等概率抽样的分类
1、放回不等概率抽样
每次在总体中对每个单元按入样概率进行抽样,抽取出来的样本单元放回总体,然后进行下一次抽样,这样,每次抽样过程都是从同一个总体独立进行的,这种不等概率抽样称为(有)放回不等概率抽样。由于是放回的,因此某个单元可能在样本中出现多次,出现这种情况时,对这个单元的调查只进行一次,但计算时按抽样中几次计算几次的原则进行。
放回不等概率抽样中,最常用的是按照总体单元的规模大小来确定单元在每次入样的概率。假设总体中第个单元的大小或规模的度量为,总体的总规模为:这种不等概率抽样称作放回的与规模大小成比例的概率抽样(probability proportional to size),简称PPS抽样。
PPS抽样的实施主要有两种方法:代码法与拉希里法。
(1)代码法
在PPS抽样中,赋予每个单元与相等的代码数,将代码数累加得到,每次抽样都产生一个[1, ]之间的随机数,设为m,则代码所对应的单元被抽中。如此进行n次抽取,就构成了PPS抽样的样本。如果不是整数,则乘以某个倍数,使为整数,每个单元赋予与相等的代码数,然后进行代码法抽样。
例1,设某个总体有N=10个单元,相应的单元大小及其代码如下表所示,用PPS方法抽取一个n=3的样本。
累计 代码 1 0.6 6 6 1~6 2 14.5 145 151 7~151 3 1.5 15 166 152~166 4 13.7 137 303 167~303 5 7.8 78 381 304~381 6 15 150 531 382~531 7 10 100 631 532~631 8 3.6 36 667 632~667 9 6 60 727 668~727 10 1.1 11 738 728~738 738 表中的是由于不是整数,乘以某个倍数后变为整数,这样就可以给每个单元赋予与相等的代码数,然后实施代码法抽样。先在[1,783]中产生第一个随机数为354,再在[1,783]中产生第二个随机数为553,最后在[1,783]中产生第三个随机数为493,则所对应的第5、7、6号单元被抽中。
(2)拉希里法
不需要累计,两次随机数决定抽中的单位。第一次:1-N之间的随机数;第二次:1-之间的随机数如果,第个单位被抽中。
在例1中,=150,N=10,在[1,10]和[1,150]中分别产生(n,m):
(3,120), =15=121,舍弃,重抽;
(8,50), =36=50,舍弃,重抽;
(7,77), =100=77,第7号单元入样;
(5,127), =78=127,舍弃,重抽;
(4,77), =137=77,第7号单元入样;
(9,60), =60=60,第7号单元入样;
因此,第4、7、9号单元被抽中。
2、不放回不等概率抽样
对于不放回不等概率抽样,样本的抽取可以有以下几种方法:
(1)逐个抽取
您可能关注的文档
最近下载
- 教师资格证初中数学教案汇总.pdf VIP
- 海外留学生体育活动参与情况与身体素质的研究教学研究课题报告.docx
- 教科版新版科学三年级上册《8.天气的影响》教案.docx VIP
- 如何设计护理研究方案.pptx VIP
- 英语演讲技巧与实践 课件 Chapter1 Understanding Public Speaking.pptx
- 低空与低空经济分析与研究.pptx VIP
- 成长英语教师用书 进阶篇PPTUnit 7.pptx VIP
- 农村宅基地培训.pptx VIP
- 变电站设备巡视检查及验收培训课件[1].ppt VIP
- 《保险基础与实务》(徐昆第4版) 课件 第二章 保险原则与保险合同.pptx
文档评论(0)