抽样技术-不等概抽样培训课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样技术-不等概抽样培训课件

第五章 不等概抽样 第一节 不等概抽样 例 O’Brien et al.(1995) 对Philadelphia地区的病人进行抽样,目的是了解病人对于医疗服务的偏好。目标总体是这一区域的所有注册的医院的病人。 总共有294家医院,27652个床位(抽样以前,研究人员只知道床位数,不知道病人数)。 等概率的抽取样本医院的缺点? 首先,可能医院中愿意接受CPR治疗的病人数量会正比与医院床位的数量,采用等概简单估计量可能会有大的方差。 其次,自加权的等概率样本可能难于管理。可能仅仅为了调查一两个病人就需要去一家医院,并且合理分配调查人员的工作负担也是比较困难的。 第三,调查成本在调查开始的时候是未知的----一个40个医院的样本可能包括了主要的大的医院,这会导致比预计更大的成本。 其他办法? 调查人员还可以采用与医院病床数量成比例的方法抽取57个医院,然后从每个样本医院中抽取30个简单随机样本床位。 如果病人数等于床位数,并且医院实际的床位数和抽样时依据的病床数据一致,每个病人是否有相同的入样概率? 而且成本在调查实施前是已知的,因为每个访员在每个医院访问的病人数量是相同的。而且,总体总量的方差可能更小 第一节 不等概抽样 分层抽样:抽样选择概率小的单位会有较高的权数。 采用不等概率抽样来减少抽样方差而不采用清晰的分层。采用不同的概率来选择初级样本单元,并且在估计中采用不同的权数来进行弥补。 抽样的关键是每个样本的选择概率是已知的。 场合:总体单元差异比较大时; 抽样审计; 多阶段的PSU. 入样概率不同是否导致估计偏差? 例如“水野法”抽样使得比估计为无偏估计量 不等概的必要性 1、提高估计精度 2、方回的PPS抽样简化方差计算 应用条件: 通常需要知道一个辅助变量,用以确定其入样概率 第一节 不等概抽样 1.放回不等概抽样 每次在总体中对每个单元按入样概率进行抽样,抽取出来的样本单元放回总体,然后进行下一步抽烟。这样,每次抽样过程都是从同一个总体独立进行的,这种不等概抽样称为(有)放回不等概抽样 第一节 不等概抽样   第一节 不等概抽样 这种不等概抽样称作放回的与规模大小成比例的概率抽样(probability proportional),简称PPS抽样。实际问题中总体单元大小的度量往往不止一个,比如企业员工数量、产值、销售量、利润等都可以度量企业规模的大小。 PPS的实施主要有两种方法:代码法与拉希里(Lahiri)法   第一节 不等概抽样 [2]拉希里方法 不需要累计,两次随机数决定抽中的单位。 第一次:1-N之间的随机数i 第二次: 1-maxM之间的随机数m 如果Mi m,第i个单位被抽中 第一节 不等概抽样 2.不放回不等概抽样 对于不放回抽样,对总体参数的估计及其方差估计比较简单,但样本单元中可能有单元被抽中多次,直观上看,没有必要对同一单元调查多次,因此可以考虑放回不等概抽样,即每次在总体中对每个单元按入样概率进行抽样,抽取出来的样本单元不再放回总体,对总体中剩下的单元进行下一次抽样。 第一节 不等概抽样 对于不放回不等概抽样,样本的抽取可以有以下几种方法 (1)逐个抽取 (2)重抽法 (3)全样本抽取;样本量随机 (4)系统抽样法 第二节 放回不等概抽样 一 只抽取一个样本单元(n=1)的不等概抽样 为了演示不等概抽样的思想,先看一个例子。一个城市有4个超市,营业面积从100平米到1000平米。我们的目标是通过抽取一家超市来估计4个超市上个月的总销售量 因为我们只抽取一个超市,所以超市第一次被抽中的概率 等于超市进入样本(入样)的概率 。这个例子中,入样概率正比于超市营业面积 第一节 不等概抽样 因为超市A占四个超市营业面积的1/16,所以它的入样概率为1/16。假设我们知道所有超市的销售额 超市 营业面积㎡ (万元) A 100 1/16 11 B 200 2/16 20 C 300 3/16 24 D 1000 10/16 245 Total 1600 1 300 第二节 放回不等概抽样 在估计中,可以使用选择概率来弥补不等概率抽样。如果超市的营业面积近似正比于超市的销售额,那么超市A的销售额就占所有超市销售额的1/16,因此超市A的销售额乘16可以近似的估计所有超市的销售额。因此,样本量为1的不等概率抽样的总体总量估计量为 第二节 放回不等概抽样 样本 Zi yi [A] 1/16 11 176 15375 [B] 2/16 20 160 19600 [C] 3/16 24 128 29584 [D] 10/16 245 392 8464 四个n=1的可能的不等概抽样 第二节 放回不等概抽样 第二节 放回不等概抽样 例如 样本 [A] 1

文档评论(0)

wangxue1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档