网站大量收购独家精品文档,联系QQ:2885784924

ch8 讲课 二阶及多阶抽样课件.ppt

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 二阶及多阶抽样 8.1 概述 4.抽样方法:多阶抽样中每一个阶段的抽样可以相同,也可以不同,它通常与分层抽样、整群抽样、系统抽样结合使用。一般来说,当初级单元大小相同时,第一阶段的抽样采用简单随机抽样;当初级单元大小不同时,第一阶段的抽样采用不等概抽样。 上面的二阶抽样可用sas编程如下: 初级单元大小相等时的二阶抽样 一、总体均值的估计量: 假定总体由N个初级单元组成,每个初级单元都含有M个次级单元,简称初级单元规模相等的两阶段抽样。否则称为初级单元规模不相等的两阶段抽样。 现对第一种情况:从N个初级单元中按简单随机抽样抽取n个初级单元, 再从每个被抽中的初级单元中按简单随机抽样抽取m个次级单元。 推导 过程 三、估计量及其性质 (一)总体均值的估计:对于初级单元大小相等的二阶抽样,如果两个阶段都是简单随机抽样,且对每个初级单元,第二阶抽样是相互独立进行的,则对总体均值 的无偏估计为: 证明: 方差估计式中,第一项是主要的,第二项要小得多,这是因为第二项的分母是第一项的m倍,而且它还要乘以小于1 的f1。影响精度的主要是初级单元,所以抽样设计的原则:在经费一定时,多抽一些初级单元,少抽一些二级单元比较好。 如果第一阶的抽样比f1可以忽略,则方差估计式可以简单为如下的结果: 这个结果在实际工作中非常有用,因为第二阶抽样采用等距抽样或某些复杂抽样时,方差的无偏估计很难得到,当f1可以忽略时,只需要初级单元指标按次级单元的平均值就可以得到方差的估计。 样本量的确定 一、初级单元大小相等时,最优样本量m与n的确定: 1.m的确定: 线性费用函数: 初级单元大小不等时的二阶抽样 一、简单估计 第一阶抽样按简单随机抽样从N个初级单元中抽取n个, 第二阶抽样按简单随机抽样,在抽中的初级单元中分别独立抽取mi,i=1…n,个2级单元。 (1)简单估计: (2)比估计: 例(续前例)若c1/c2=10, =15,试确定最优m,n 解:首先计算mopt,由上例已知 进一步计算nopt 因此 在实际工作中,对于各级单元大小不相等时的多阶抽样,通常的做法是:除了最后一阶采用等概率抽样(放回的或不放回的均可),前几阶均采用PPS( sampling with probabilities proportional to sizes,简称PPS抽样)抽样, 具体放在不等概部分讲解。 在实际的抽样中,初级单元的大小很少是相同的,针对大小不同的初级单元,在抽样方法上有等概率抽样和不等概率抽样,在估计方法上有简单估计和比估计。 1、等概抽样实现:设总体中初级单元数为N,从中等概抽取n个单元,其大小为Mi(i=1,2,…,n), 第二阶段在抽中的初级单元中等比例抽取基本单元,即抽样比相同: f2i=mi/Mi=f2 2、也可采用不等概抽样(以后再讲) 例题:某居委会欲了解居民健身活动的情况,如果已知该居委会有500名居民,在所居住的10个单元中抽取了4个单元,然后在样本单元中分别抽出若干居民,两阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身活动的时间(10分钟为一单位),估计居民平均每天用于锻炼的时间,并给出估计的标准差。 2.2 4.17 4,3,6,2,4,6 6 54 4 7 4.5 3,2,5,8 4 36 3 2.8 3.4 2,2,4,3,6 5 45 2 2.92 3.75 4,2,3,6 4 32 1 时间yij mi Mi 初级 解:采用简单估计 由此看出,二阶抽样抽样误差主要是由第一项决定,抽样时尽量多抽一些初级单元,少抽一些次级单元比较好。 例题:某居委会欲了解居民健身活动的情况,如果已知该居委会有500名居民,在所居住的10个单元中抽取了4个单元,然后在样本单元中分别抽出若干居民,两阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身活动的时间(10分钟为一单位),估计居民平均每天用于锻炼的时间,并给出估计的标准差。 2.2 4.17 4,3,6,2,4,6 6 54 4 7 4.5 3,2,5,8 4 36 3 2.8 3.4 2,2,4,3,6 5 45 2 2.92 3.75 4,2,3,6 4 32 1 时间yij mi Mi 初级 设 表示第i个一阶单元的二阶样本单元中具有某特性 的单元占的比例,则总体中具有该特性的单元占的比 例的估计量 在估计 的公式中,令 3、比例的估计 例:某省卫生部欲对城市饮食业的卫生状况做一次抽样调查,在全省32个城市中随机抽

文档评论(0)

brnpnu31163 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档