网站大量收购闲置独家精品文档,联系QQ:2885784924

[理学]抽样技术不等概率抽样.ppt

  1. 1、本文档共73页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
某系统各单位上一年与当年职工人数 某系统各单位上一年与当年职工人数 某系统各单位上一年与当年职工人数 某系统各单位上一年与当年职工人数 某系统各单位上一年与当年职工人数 解: 对单位进行PPS抽样:根据公式,Y的汉森-赫维茨估计 的理论方差为: 五.按与群大小Mi成比例的PPS抽样抽取群: 例:某公司分8个部门,共有职工12950人,各部门职工 数如下: 按与职工数成比例的概率抽3个部门。 (1)随机数为2011、7972、10281,问抽中哪几个部 门? (2)若三个部门的职工病假天数依次为4320、4160、 5790。估计该公司每个职工平均病假天数及标准差。 解: 六 多阶段有放回不等概抽样 对初级单元进行放回不等概率抽样时,总体总和Y的估计 第一阶抽样按放回不等概率抽样(多项抽样)抽取初级元, 第二阶抽样并没有作出特别的规定,只要初级单元指标Yi的估计 是无偏的. 自加权情形: 第一阶抽样按放回不等概率抽样抽取初级单元, 第二阶抽样都抽取m个。 自加权情形: 第一阶抽样按PPS抽样抽取初级单元, 第二阶抽样按简单随机抽样抽取次级单元,都抽取m个。 实际工作中,对于各级单元大小不相等时多阶抽样,自加权通常的做法是: 除了最后一阶采用等概率抽样(放回的或不放回的均可),前几阶均采用PPS抽样,并且自第二阶开始,每一阶的样本量都相同(即mi=m,kj=k,…),则样本是自加权的,其估计量的形式非常简单。 总体总和的估计为 的方差估计为 七、各级单元大小不相等时,多阶抽样的总样本量及最 优样本量的配置 二阶自加权情形: 第一阶抽样按PPS抽样抽取初级单元, 第二阶抽样按简单随机抽样抽取次级单元,都抽取m个。 实际工作中,对于各级单元大小不相等时多阶抽样,自加权通常的做法是: 除了最后一阶采用等概率抽样(放回的或不放回的均可),前几阶均采用PPS抽样,并且自第二阶开始,每一阶的样本量都相同(即mi=m,kj=k,…),则样本是自加权的,其估计量的形式非常简单。 总体总和的估计为 的方差估计为 这时,多阶抽样的总样本量可以这样确定: 1.根据简单随机抽样时应抽样本量 2.再乘以设计效应deff获得。 多阶抽样与简单随机抽样相比其效率比较低,deff 应该大于1。实际工作中,可取deff的经验数据。不同项 目的deff不同。 例: 某调查公司接受了一项关于全国城市成年居民人均奶制品消费支出及每天至少喝一杯鲜奶的人数的比例情况的调查。确定抽样范围为全国地级及以上城市中的成年居民。成年居民指年满18周岁以上的居民。 第一步:确定抽样方法。 调查公司决定采用多阶抽样方法进行方案设计,调查的最小单元为成年居民。确定调查的各个阶为城市、街道、居委会、居民户,在居民户中利用二维随机表(Kish随机表的简化)抽取成年居民。 第二步:确定样本量及各阶样本量的配置。 按简单随机抽样时,在95%置信度下,绝对误差为5%,取使方差达到最大时的消费奶制品的居民比例为50%,则全国样本量应为: 根据以往调查的经验,估计回答率b=80%,因此调整样 本量为: 多阶抽样的效率比简单随机抽样的效率低,这里取设计 效应deff=3.2,则在全国范围内应调查的样本居民为: 各阶的样本量配置为: 初级单元:20个城市; 二级单元:每个样本市内抽4个街道,共80个街道; 三级单元:每个样本街道内抽2个居委会,共160个居委会; 四级单元:每个样本居委会内抽10个居民户,1600个居户。 在样本居民户内,利用二维随机表抽1名成年居民。 第三步:确定抽样方法。 第一阶,在全国城市中按与人口数成比例的放回的不等 概抽样,即PPS抽样。 第二阶和第三阶分别按与人口数成比例的不等概等距抽 样。 以第二阶为例,在某个被抽中的样本城市中,将其所属 的街道编号,搜集各街道的人口数,赋予每个街道与其人口 相同的代码数;根据该市总人口数除以样本量4,确定抽样间 距;然后对代码进行随机起点的等距抽样,则被抽中代码所 在的街道为样本街道。 第四阶,分别在每个样本居委会中,按等距抽样抽出10个 民户。 即根据居委会拥有的居民户数除以样本量10得到抽样距, 然后随机起点等距抽样。 在每个样本居民户中,调查员按二维随机表抽取1名成年居民。二维随机表的使用方法如下。 (1)随机号的确定。应事先在随机表的第一行数字上,选好一个数字,并划上一个圈,被圈好的这个数字就是这份问卷的随机号。随机号的选择一般由小到大或循

文档评论(0)

好文精选 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档