抽样技术不等概率抽样.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章 不等概抽样;第一节 不等概率抽样概述;2、抽样单元在总体中所占的地位不一致:例如:要反映某小麦品种的优良情况,以村作为抽样单位,但各村的种植面积不同,一些种植面积大的村庄在抽样中是否被抽中对推断总体的结果有很大影响 ,所以让“大单元”被抽到的概率大,“小单元”被抽到的概率小,这样能够大大提高样本的代表性,减少抽样误差。 ; 不等概率抽样的特点;不等概率抽样的特点;6;放回不等概抽样;在PPS抽样中,赋予每个单元与Mi相等的代码数,将代码数累加得到M0,每次抽样都等概产生一个[1,M0]之间的随机数,设为m,代码m所对应的单元被抽中。;;例:假设有10个乡,每个乡的村庄数不同,按pps抽3个乡;2.拉希里法(二次抽取法)(统计学家Lahiri最先提出): ;;三、Hansen-Hurwitz(汉森-郝维茨)估计量及其性质: ;对上述结论加以说明:;;例:某县农业局要调查全县养猪专业户今年生猪的出栏头数,现有全县365个养猪专业户去年的生猪存栏数,各专业户的规模相差较大,决定以放回方式按与各养猪专业户上年末生猪存栏头数成比例的PPS抽样 从中抽取30户进行调查,结果如下,已知全县养猪专业户上年末生猪存栏头数为9542头,试估计该县养猪专业户生猪今年出栏总头数和抽样标准误。(摘自:“应用抽样技术”李金昌);i;解:根据题中所给资料,n=30,M0=9542,;例5.2:某部门要了解所属8500家生产企业当月完成的利润,该部门手头已有一份去年各企业完成产量的报告,将其汇总得到所属企业去年完成的产量为3676万吨。考虑到时间紧,准备采用抽样调查来推算当月完成的利润。根据经验,企业的产量和利润相关性比较强,且企业的特点是规模和管理水平差异比较大,通常大企业的管理水平较高些,因此采用与去年产量成比例的PPS抽样,从所属企业中抽出一个样本量为30的样本。 ;;;有放回不等概整群抽样;例 某企业欲估计上季度每位职工的平均病假天数。该企业共8个分厂,现用不等概整群抽样拟抽取3个分厂,并以置信度95%计算其置信区间。;有放回不等概整群抽样;有放回不等概整群抽样;多阶段有放回不等概抽样;多阶段有放回不等概抽样;例:某县农村共有14个乡509个村,在实现小康的进程中欲计算该县农村的恩格尔系数,即居民户的食品支出占总支出的比例。首先要调查全县的食品总支出,现采用了二阶段抽样,第一阶段先在14个乡中,按村的数目多少进行PPS抽样,共抽了5个乡,第二阶段在抽中的乡中随机地抽选6个村,然后对抽中的村做全面调查,取得的数据如下,估计全县的食品支出总额及其标准误。;多阶段有放回不等概抽样例题分析; 例;某小区有10座高层建筑,每座高层建筑 拥有的楼层数如下表, ;解:已知n=5,m=2,M0=145,;这时,多阶抽样的总样本量可以这样确定: 1.根据简单随机抽样时应抽样本量 2.再乘以设计效应deff获得。 多阶抽样与简单随机抽样相比其效率比较低,deff 应该大于1。实际工作中,可取deff的经验数据。不同项 目的deff不同。 下面是一案例分析;例: 某调查公司接受了一项关于全国城市成年居民人均奶制品每天至少喝一杯奶的人数的比例情况的调查。确定抽样范围为全国地级及以上城市中的成年居民。成年居民指年满18周岁以上的居民。 第一步:确定抽样方法。 调查公司决定采用多阶抽样方法进行方案设计,调查的最小单元为成年居民。确定调查的各个阶段为城市、街道、居委会、居民户,在居民户中利用 简单随机法抽取成年居民。 第二步:确定样本量及各阶样本量的配置。 按简单随机抽样时,在95%置信度下,绝对误差为5%,取使方差达到最大时的消费奶制品的居民比例为50%,则全国样本量应为: ;根据以往调查的经验,估计回答率b=80%,因此调整样 本量为: 多阶抽样的效率比简单随机抽样的效率低,这里取设计 效应deff=3.2,则在全国范围内应调查的样本居民为: 各阶的样本量配置为: 初级单元:20个样本城市; 二级单元:每个样本市内抽4个街道,共80个街道; 三级单元:每个样本街道内抽2个居委会,共160个居委会; 四级单元:每个样本居委会内抽10个居民户,1600个居民户。 在样本居民户内,利用随机表抽1名成年居民。;第三步:确定抽样方法。 第1阶,在全国城市中按与人口数成比例的放回的不等 概抽样,即PPS抽样(probability propotional to size)。 第2阶和第3阶分别按与人口数成比例的不等概等距抽 样。 以第2阶为例,在某个被抽中的样本城市中,将其所属 的街道编号,搜集各街道的人口数,赋予每个街道与其人口 相同的代码数;根据该市总人口数除以样本量4,确定抽样间 距;然后对代码进行随机起点

文档评论(0)

189****5087 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7102116031000022
认证主体仪征市思诚信息技术服务部
IP属地江苏
统一社会信用代码/组织机构代码
92321081MA278RWX8D

1亿VIP精品文档

相关文档