- 1、本文档共81页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
等概率整群抽样和多阶段抽样
第二节 初级单元大小相 等时的二阶抽样 定理4.5: 对于初级单元相等的两阶段抽样,如果两个阶段都是简单随机抽样,且对于每个初级单元,第二阶抽样是相互独立进行的, 则对总体均值的无偏估计为 其方差为 其中: 的无偏估计为 【例】欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水帐,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水帐。调查的结果如下: 要求根据这些数据推算100家企业该指标的总量,并给出估计的95%置信区间。 样本企业 第一日 第二日 第三日 1 57 59 64 2 38 41 50 3 51 60 63 4 48 53 49 5 62 55 54 样本企业 1 60 13 2 43 39 3 58 39 4 50 7 5 57 19 方差估计式中,第一项是主要的,第二项要小得多。因为第二项的分母是第一项的m倍,且要乘以小于1 的f1 如果第一阶的抽样比f1可以忽略,则方差估计式可以简单为如下的结果: 这个结果在实际工作中非常有用,因为第二阶抽样采用等距抽样或某些复杂抽样时,方差的无偏估计很难得到,当f1可以忽略时,只需要初级单元的均值就可以得到方差的估计。 ai,第i个初级单元中具有某特征的次级单元数。 简单估计量 初级单元规模不等二阶段抽样 自加权条件:第二阶(段)抽样比为一个常数 比率估计量 考虑费用函数 二级m的最优值 其中 再根据费用等要求,确定n 简单随机抽样的方差公式为 等群抽样的设计效应为 整群抽样的估计效率,与群内相关系数 的关系密切 当 =1时,deff=M 当 =0时,deff=1 当 为负时,deff1,取值范围是 群内方差为0 群内方差与总体方差相等 群间方差为0 群内相关系数也可由样本统计量 表示 较大,则分层抽样精度较高, 而整群抽样的精度较低。 例2 由例1数据,计算群内相关系数与设计效应 解:样本群间方差 而群内方差为 表明为达到同样的估计精度,整群抽 样的样本量大约为简单随机抽样样本 量的2.74倍. 若 令为简单随机抽样的样本量则 即用简单随机抽样18个学生,可达到整群抽样48个学生相同的估计精度 2 群Mi规模不等时的估计 如果各群规模不等,前面简单估计量是有偏的 等概抽样,总体均值的无偏估计 其中 总体总量Y的估计为 其中, 或用等价的公式 估计量的方差为 它的无偏估计为 均值估计 的方差为 群规模差别大,会造成Yi差异大,导致估计精度低 等概抽样,比率估计 总体均值估计为 这里辅助变量不是Xi而是群规模Mi 总体总量估计为 估计量的方差分别是 与 的样本估计分别是 例3:某县有33个乡,726个村,某一年度某农作物总种植面积30525亩. 现采用等概抽样随机抽出10个乡,要求利用无偏估计量和比率估计量分别估计全县总产量,并给出估计量的标准差。 样本乡 编号 村庄数 Mi 作物总产量(乡) yi(万公斤) 种植面积(乡) xi(亩) 1 2 3 4 5 6 7 8 9 10 15 18 26 14 20 28 21 19 31 17 22.0 22.8 30.2 21.7 25.3 31.2 26.0 20.5 33.8 23.6 800 780 1000 700 880 1100 850 800 1200 830 1.4667 1.2667 1.1615 1.55 1.265 1.1143 1.2381 1.079 1.0903 1.3882 合计 209 257.1 8940 —— 1. 无偏估计 评价:虽是无偏估计量,但方差不小 2 以群规模为辅助变量的比率估计 评价:有偏,n较大时比较理想 3 以种植面积为辅助变量的比率估计 已知:用种植面积X=30525(亩) 为辅助变量 评价:估计量的估
文档评论(0)