- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 不等概率抽样
例 O’Brien et al.(1995) 对Philadelphia地区的病人进行抽样,目的是了解病人对于医疗服务的偏好。目标总体是这一区域的所有注册的医院的病人。 总共有294家医院,27652个床位(抽样以前,研究人员只知道床位数,不知道病人数)。 等概率的抽取样本医院的缺点? 首先,可能医院中愿意接受CPR治疗的病人数量会正比于医院床位的数量,采用等概简单估计量可能会有大的方差。 其次,自加权的等概率样本可能难于管理。可能仅仅为了调查一两个病人就需要去一家医院,并且合理分配调查人员的工作负担也是比较困难的。 第三,调查成本在调查开始的时候是未知的----一个40家医院的样本可能包括了主要的大的医院,这会导致比预计更大的成本。 其他办法? 调查人员还可以采用与医院病床数量成比例的方法抽取57个医院,然后从每个样本医院中抽取30个简单随机样本床位。 如果病人数等于床位数,并且医院实际的床位数和抽样时依据的病床数据一致,每个病人是否有相同的入样概率? 而且成本在调查实施前是已知的,因为每个访员在每个医院访问的病人数量是相同的。而且,总体总量的方差可能更小。 分层抽样:抽样选择概率小的单位会有较高的权数。 采用不等概率抽样来减少抽样方差而不采用清晰的分层。采用不同的概率来选择初级样本单元,并且在估计中采用不同的权数来进行弥补。 抽样的关键是每个样本的选择概率是已知的。 5.1 不等概抽样 一、不等概抽样的必要性: 在简单随机抽样中,总体(或层)中的每个单元入样的概率都相等。如果总体中的每个单元在该总体中的地位(或重要性)相差不多,则这种基于等概率的抽样是理所当然的选择。等概率抽样不仅实施简单,而且相应的数据处理公式也简单。但是在许多实际问题中,我们还需要使用不等概抽样(sampling with unequal probabilities)。 二、不等概率抽样的适用场合: 一种情况是调查的总体单元与抽样总体的单元可能不一致; 另一种需要用到不等概抽样的情况是,抽样单元在总体中所占的地位不一致; 最重要的一种不等概抽样乃是使每个单元入样的概率与该单元的大小成比例的抽样(sampling with probabilities proportional to sizes,简称PPS抽样)。 二、不等概率抽样的适用场合: 第三种需用不等概率抽样的情况是为了改善估计量的特性。 每个可能的样本若被抽的概率与样本中单元的辅助变量之和成正比的话,则按此进行不等概抽样所得到的样本,用通常的比估计方法所得的估计量是无偏的。 四、不等概抽样的特点 不等概抽样的主要优点是: 由于使用了辅助信息,提高了抽样策略的统计效率,与简单随机抽样甚至与分层抽样相比,能显著地减少抽样误差。 不等概抽样有以下的缺点: 1)抽样框中的所有单元,都要有高质量的、能用作大小度量的辅助信息; 2)抽样框的创建比简单随机抽样和系统抽样成本高,更复杂,因为需要度量和存储总体中每一个单元的大小; 3)并非在任何情况下都能使用,因为并不是每一个总体都有稳定且与主要调查变量相关的有关大小或规模的度量; 4)抽样及估计(特别对不放回抽样)相当复杂; 5)当单元大小度量不准确或不稳定时不适用,此时更好的办法是将单元按大小分组并使用分层抽样。 5.2 放回不等概抽样 一、多项抽样与PPS抽样: 1.多项抽样: *这种放回的不等概率抽样为何又叫多项抽样? 2.PPS抽样 : 2.拉希里法(二次抽取法): 三、Hansen-Hurwitz估计量及其性质: 某系统各单位上一年与当年职工人数 某系统各单位上一年与当年职工人数 某系统各单位上一年与当年职工人数 某系统各单位上一年与当年职工人数 某系统各单位上一年与当年职工人数 解: 对单位进行PPS抽样:根据公式,Y的汉森-赫维茨估计 的理论方差为: 而若对单位进行简单随机抽样,同样样本量时Y的简单估计 的方差可计算如下: 因此在此例中,PPS抽样的设计效应为: 可见对PPS抽样,估计量的精度提高非常显著。 在实际中 当然是未知的,只有抽样才能观测到。下面列出4组PPS样本,分别计算Y的估计量并作方差估计。4组样本抽得的单位号码如下: 样本I:4,10,23,11,13,3; 样本II: 1,34,18,11,29,8; 样本III:12,10,36,4,24,4; 样本IV:14,4,18,11,34. 对每个样本 ,计算Y的估计量,记为 。为方便起见,令 则 计算结果列在下表中。 对前面表的总体进行n=6的PPS抽样的结果 注意到
您可能关注的文档
- 第4章 车身焊接.ppt
- 第4章 营业税(最新)PPT.ppt
- 第4章 药学技术人员管理.ppt
- 第4章-5 时间同步.ppt
- 第4章 电化学与金属腐蚀-2016.pptx
- 第4章 物态变化(二)(图片版) (共83张PPT).ppt
- 第4章+自顶向下语法分析方法.ppt
- 第4章_WindowsXP操作系统基础.ppt
- 第4章 气动技术基础.ppt
- 第4章__QuartuaII的HDL输入设计.ppt
- 第一单元第2课《开放互联--网络协议与标准》课件 【清华大学出版社】《信息科技》七年级上册.pptx
- 第一单元第2课-传感之古今未来+课件+2025-2026学年人教版(2024)初中信息科技八年级全一册.pptx
- 2.3.1微生物的分布(课时1)课件2025-2026学年人教版生物七年级上册.pptx
- 2.3.1微生物的分布(课时2)课件2025-2026学年人教版生物七年级上册.pptx
- 7.2维护祖国统一(教学课件)-【咕噜老师】2025-2026学年九年级道德与法治上册优质课件+教学设计+(统编版).pptx
- 第5课+物联功能趣体验(课件)-2025-2026学年信息科技八年级全一册人教版(2024).pptx
- 2.2.2.3+++鸟和哺乳动物第一课时课件2025-2026学年人教版生物七年级上册.pptx
- 第二单元+第3节《红外传感技术应用》课件2025-2026学年广东教育出版社信息科技学习手册八年级全一册.pptx
- 一、电功(培优教学课件)物理苏科版2024九年级下册.pptx
- 第二单元第2课《互联网时代来临--告诉我地址--从IPv4到IPv6的传奇》课件 【清华大学出版社】《信息科技》七上.pptx
原创力文档


文档评论(0)