- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
估计量的方差是: 估计量方差的估计为: 【例5.3】 某企业欲估计上季度每位职工的平均病 假天数。该企业共有8个分厂(工人数资料见下表), 现用不等概整群抽样拟抽取三个分厂为样本,并以 95%的置信度计算其置信区间。有关数据及抽样过程 如下: 9751~12950 3200 8 9361~9750 390 7 7451~9360 1910 6 4611~7450 2840 5 3751~4610 860 4 1651~3750 2100 3 1201~1650 450 2 1~1200 1200 1 累积区间 职工人数 分厂编号 8个分厂的职工人数资料 【解】 采用PPS抽样,利用随机数表在数字 1~12950之间随机抽取3个数,分别是02011, 07972和10281,于是3分厂、6分厂和8分厂入 选样本。用 分别表示三个分厂职工 的病假天数,调查结果为: 同样可求得估计量方差的估计值为: 其95%的置信区间为: 【评价】 对于群规模不等的整群抽样,采用不等 概PPS抽样,可以得到总体目标量的无偏估计,估计 量和估计量方差都有比较简明的形式,估计的效率 也比较高,确实是值得优先采用的方法。但是此方 法使用的条件是:在抽取样本前,要了解有关群规 模大小的信息。此外,抽样过程比等概整群抽样更 为复杂。 §5.3 多阶段有放回不等概抽样 一、两阶段有放回不等概抽样 抽样方法:对初级单元进行抽样时,先确定每个 初级单元的入样概率。对被抽中的初级单元,再抽 取 个二级单元。如果某个初级单元被抽中多次, 则将这 个二级单元放回,重新抽取 个二级单元。 当然,这两个样本中的二级单元可能会有重复。在 实际调查时,对重复的二级单元只调查一次,但计 算的时候,应该按照被抽中的次数进行重复计算。 总体总值的估计:先构造初级单元总值 的无偏 估计 然后利用汉森-赫魏茨估计量对总体总值Y 进行估计: 特别地 记总体中所有二级单元数为 ,如果抽样时 每个初级单元被抽中的概率与其拥有的二级单元数成 比例,即初级单元被抽中的概率为 第二 阶段对二级单元进行简单随机抽样,则 ,样本 是自加权的,对总体总值的估计为: 在实际调查中,如果初级单元大小不相等,人们 通常喜欢在第一阶段时按放回的与二级单元成比例 的PPS抽样,第二阶段抽样则进行简单随机抽样,且 每个初级单元的二级单元样本都相同,这样得到的样 本是自加权的,估计量的形式非常简单。 【例5.4 】某小区拥有10座高层建筑,每座高层建筑拥 有的楼层数如下表 20 16 18 10 16 10 15 16 12 12 楼层 J I H G F E D C B A 高层建筑 10座高层建筑的层数 我们用两阶段抽样方法抽出10个楼层进行调查, 第一阶段抽样为放回的按与每层建筑拥有的楼层成 比例的不等概抽取5座建筑,第二阶段按简单随机抽 样对每座建筑抽取两个楼层。对10个楼层居民人数 的调查结果如下,试对小区总居民数进行估计,并 给出估计的误差。 16,11 16,10 19,13 15,18 18,12 居民数 5 4 3 2 1 初级样本序号 被选中的高层建筑序号及10个楼层的居民数 【解】已知 二、多阶段有放回不等概抽样 (略) 参看教材P174 §5.3 不放回不等概抽样 一、πPS 抽样 不放回不等概抽样: 我们知道,若采用放回抽样,对总体参数的估计 及其方差估计比较简单,但样本单元中可能有单元 被抽中多次.因此,放回抽样得到的样本其代表性比 不放回抽样差.在相同样本量的条件下,放回抽样的 估计精度较低. 不放回不等概抽样是指不放回的与单元大小成 比例的概率抽样. 包含概率: 在不放回不等概抽样中,每 个单元入样的概率 及任意两个单元同时入 样的概率 统称为包含概率. 对固定的 n ,包含概率满足下面等式: 如果每个单元入样概率与其大小 严格成比例 则对于固定的 n ,有 这时,我们简称这种情形的抽样为严格的 抽样。 求得,只有在 n=2 时才有一些实用的方法。 严格的 抽样实施起来非常复杂, 不易 二、赫魏慈—汤普森估计量 对于不放回不等概抽样,其总体总量Y的 估计是: 赫魏慈—汤普森估计: 为第i个单元的包含概率. 其中 如果 则 的无 偏估计,它的方差为: 如果 n 固定,则 【例5.3】假设有5个居委会,每个居委会的住户数X 已知,但常住居民人数未知,我们从这5个居委会抽出两 个来估计常住居民的总人数,调查数据如下
原创力文档


文档评论(0)