讲稿5-不与等概抽样 .ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
讲稿5-不与等概抽样

例 O’Brien et al.(1995) 对Philadelphia地区的病人进行抽样,目的是了解病人对于医疗服务的偏好。目标总体是这一区域的所有注册的医院的病人。 总共有294家医院,27652个床位(抽样以前,研究人员只知道床位数,不知道病人数)。 等概率的抽取样本医院的缺点? 首先,可能医院中愿意接受CPR治疗的病人数量会正比与医院床位的数量,采用等概简单估计量可能会有大的方差。 其次,自加权的等概率样本可能难于管理。可能仅仅为了调查一两个病人就需要去一家医院,并且合理分配调查人员的工作负担也是比较困难的。 第三,调查成本在调查开始的时候是未知的----一个40个医院的样本可能包括了主要的大的医院,这会导致比预计更大的成本。 其他办法? 调查人员还可以采用与医院病床数量成比例的方法抽取57个医院,然后从每个样本医院中抽取30个简单随机样本床位。 如果病人数等于床位数,并且医院实际的床位数和抽样时依据的病床数据一致,每个病人是否有相同的入样概率? 而且成本在调查实施前是已知的,因为每个访员在每个医院访问的病人数量是相同的。而且,总体总量的方差可能更小。 分层抽样:抽样选择概率小的单位会有较高的权数。 采用不等概率抽样来减少抽样方差而不采用清晰的分层。采用不同的概率来选择初级样本单元,并且在估计中采用不同的权数来进行弥补。 抽样的关键是每个样本的选择概率是已知的。 类型 放回不等概抽样 不放回不等概抽样 逐个抽取 重抽法 全样本抽取;样本量随机 系统抽样法 1代码法案例 2拉希里方法 不需要累计,两次随机数决定抽中的单位。 第一次:1-N之间的随机数i 第二次: 1-maxM之间的随机数m 如果Mi m,第i个单位被抽中 估计量 对于放回不等概抽样,对总体总量的估计是汉森-赫维茨(Hansen-hurwitz)估计 可以证明 例5.2 某部门要了解所属8500家生产企业当月完成的利润,该部门手头已有一份去年各企业完成产量的报告,将其汇总得到所属企业去年完成的产量为3676万吨。考虑到时间紧,准备采用抽样调查来推算当月完成的利润。根据经验,企业的产量和利润相关性比较强,且企业的特点是规模和管理水平差异比较大,通常大企业的管理水平较高些,因此采用以与去年产量成比例的PPS抽样,从所属企业中抽出一个样本量为30的样本,                            757087(元) πPS抽样的实施 n=2条件下严格的πPS抽样 布鲁尔方法 德宾方法 n 2条件下严格的πPS抽样 水野方法 n2条件下非严格的πPS抽样 莫蒂方法 布鲁尔方法 条件:所有Zi0.5 逐个抽取: 第一个与 成比例的概率抽取 第二个与 成比例的概率在N-1个单元内抽取 德宾方法 水野方法 莫蒂方法 逐个抽取: 第一个 单元按照Zj 的概率抽取 第二个 单元按照Zj /(1 - Zi )的概率抽取 第三个 单元按照Zk /(1 - Zi- Zj )的概率抽取 依次递推,直至第n个单位 估计量: * * ?--------非概率,等概率,不等概 每个单元入样的概率 第五章 不等概抽样 场合:总体单元差异比较大时; 抽样审计; 多阶段的PSU. 入样概率不同是否导致估计偏差? 例如“水野法”抽样使得比估计为无偏估计量 (Probability Proportional to Size) 也称PPZ 累计 代码 1 0.6 6 6 1~6 2 14.5 145 151 7~151 3 1.5 15 166 152~166 4 13.7 137 303 167~303 5 7.8 78 381 304~381 6 15 150 531 382~531 7 10 100 631 532~631 8 3.6 36 667 632~667 9 6 60 727 668~727 10 1.1 11 738 728~738 =738 738 ? ? 一种多项抽样 3不等概等距抽样 K=M0/n Mi k不重复 k可能重复 2k肯定重复 例如:估计超市销售额, m:员工人数 解释公式意义 1* 38.23 10926 10 6.50 1900 19 1.50 10 2 13.70 1024 11 15.00 864 20 8.00 80 3 0.75 13 12 7.00 17 21 28.42 13672 4 2.85 30 13 16.00 1045 22* 9.0

文档评论(0)

ctuorn0371 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档