抽样调查~第5章不等概抽样.pptVIP

下载本文档

7
0
约6.31千字
约 69页
2019-12-07 发布于中国
举报
版权申诉

抽样调查~第5章不等概抽样.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

估计量的方差是：估计量方差的估计为：【例5.3】某企业欲估计上季度每位职工的平均病假天数。该企业共有8个分厂（工人数资料见下表），现用不等概整群抽样拟抽取三个分厂为样本，并以 95%的置信度计算其置信区间。有关数据及抽样过程如下： 9751~12950 3200 8 9361~9750 390 7 7451~9360 1910 6 4611~7450 2840 5 3751~4610 860 4 1651~3750 2100 3 1201~1650 450 2 1~1200 1200 1 累积区间职工人数分厂编号 8个分厂的职工人数资料【解】采用PPS抽样，利用随机数表在数字 1～12950之间随机抽取3个数，分别是02011， 07972和10281，于是3分厂、6分厂和8分厂入选样本。用分别表示三个分厂职工的病假天数，调查结果为：同样可求得估计量方差的估计值为：其95%的置信区间为：【评价】对于群规模不等的整群抽样，采用不等概PPS抽样，可以得到总体目标量的无偏估计，估计量和估计量方差都有比较简明的形式，估计的效率也比较高，确实是值得优先采用的方法。但是此方法使用的条件是：在抽取样本前，要了解有关群规模大小的信息。此外，抽样过程比等概整群抽样更为复杂。 §5.3 多阶段有放回不等概抽样一、两阶段有放回不等概抽样抽样方法：对初级单元进行抽样时，先确定每个初级单元的入样概率。对被抽中的初级单元，再抽取个二级单元。如果某个初级单元被抽中多次，则将这个二级单元放回，重新抽取个二级单元。当然，这两个样本中的二级单元可能会有重复。在实际调查时，对重复的二级单元只调查一次，但计算的时候，应该按照被抽中的次数进行重复计算。总体总值的估计：先构造初级单元总值的无偏估计然后利用汉森-赫魏茨估计量对总体总值Y 进行估计：特别地记总体中所有二级单元数为，如果抽样时每个初级单元被抽中的概率与其拥有的二级单元数成比例，即初级单元被抽中的概率为第二阶段对二级单元进行简单随机抽样，则，样本是自加权的，对总体总值的估计为：在实际调查中，如果初级单元大小不相等，人们通常喜欢在第一阶段时按放回的与二级单元成比例的PPS抽样，第二阶段抽样则进行简单随机抽样，且每个初级单元的二级单元样本都相同，这样得到的样本是自加权的，估计量的形式非常简单。【例5.4 】某小区拥有10座高层建筑，每座高层建筑拥有的楼层数如下表 20 16 18 10 16 10 15 16 12 12 楼层 J I H G F E D C B A 高层建筑 10座高层建筑的层数我们用两阶段抽样方法抽出10个楼层进行调查，第一阶段抽样为放回的按与每层建筑拥有的楼层成比例的不等概抽取5座建筑，第二阶段按简单随机抽样对每座建筑抽取两个楼层。对10个楼层居民人数的调查结果如下，试对小区总居民数进行估计，并给出估计的误差。 16，11 16，10 19，13 15，18 18，12 居民数 5 4 3 2 1 初级样本序号被选中的高层建筑序号及10个楼层的居民数【解】已知二、多阶段有放回不等概抽样（略) 参看教材P174 §5.3 不放回不等概抽样一、πPS 抽样不放回不等概抽样: 我们知道,若采用放回抽样,对总体参数的估计及其方差估计比较简单,但样本单元中可能有单元被抽中多次.因此,放回抽样得到的样本其代表性比不放回抽样差.在相同样本量的条件下,放回抽样的估计精度较低. 不放回不等概抽样是指不放回的与单元大小成比例的概率抽样. 包含概率: 在不放回不等概抽样中,每个单元入样的概率及任意两个单元同时入样的概率统称为包含概率. 对固定的 n ,包含概率满足下面等式: 如果每个单元入样概率与其大小严格成比例则对于固定的 n ,有这时，我们简称这种情形的抽样为严格的抽样。求得，只有在 n=2 时才有一些实用的方法。严格的抽样实施起来非常复杂，不易二、赫魏慈—汤普森估计量对于不放回不等概抽样，其总体总量Y的估计是：赫魏慈—汤普森估计：为第i个单元的包含概率. 其中如果则的无偏估计，它的方差为：如果 n 固定，则【例5.3】假设有5个居委会,每个居委会的住户数X 已知,但常住居民人数未知,我们从这5个居委会抽出两个来估计常住居民的总人数,调查数据如下