- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样调查-分层随机抽样培训课件(ppt 98页)
h 1 20000 0.2857 2500 2 713.2857 505.0763 2 50000 0.7143 2000 3 1428.5714 823.7861 总计 70000 1.0000 ----- ---- 2141.8571 1328.8624 关于样本量分配的计算 (1) 比例分配。 (2)一般最优分配 (3)内曼分配 结果比较 , 对比上面三组结果可以发现: ●一般最优分配在乙地所抽取的样本量是最小的。 这是因为一般最优分配考虑了费用问题,在乙地抽样的单位平均费用较高,所以最优的原则应是适当增加甲地的样本量,减少乙地的样本量。 ●一般最优分配和内曼分配在甲地的样本量都比比例分配大,这是因为甲地总体的方差较大。为了保证估计量方差小,子总体方差大的就要多抽些样本,否则就要少抽样本。 3.某些层要求大于100%抽样时的修正 又比较大,则可能按最优分配计算的这个层的样 按最优分配时,可能抽样比 较大,某个层的 本量 超过 的情况. 若出现这种情况,则对该层进行不100%的抽样, 即 §3.4 样本量的确定 (1)一般公式 令 其中 已经选定,于是当方差 V 给定时,有 得到确定样本量的一般公式为: 令 则 3.分别比率估计量与联合比率估计量的比较 一般而言,分别比率估计量的方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。 实际使用时,如果各层的样本量都较大,且有理由认为各层的比率Rh差异较大,则分别比率估计优于联合比率估计。当各层的样本量不大,或各层比率Rh差异很小,则联合比率估计更好些。 【例4.4】 某市1996年对950家港口生产单位完成的 吞吐量进行了调查,1997年欲对全市港口生产单位完成的吞吐量进行调查。对港口生产单位按非国有(h=1) 和国有(h=2)分为两层,单位数分别为800家和150家,分别在两层中调查了10家和15家港口生产单位, 调查数据如下表,试计算1997年全市港口生产单位完成的吞吐量。 1997年国有和 非国有企业调 查数据如下页 i xi yi i xi yi 1 95 80 1 495 530 2 220 210 2 210 320 3 359 384 3 360 496 4 120 117 4 230 400 5 177 180 5 600 651 6 253 258 6 1000 880 7 302 349 7 700 560 8 332 286 8 1100 1230 9 272 215 9 720 823 10 137 97 10 310 390 11 478 465 12 817 650 13 919 1160 14 1160 1070 15 735 698 (将上述数据计算的中间结果列于P77的表中) 1.按分别比率估计量估计 2.按联合比率估计量估计 按联合比率估计量 估计比按分别比率估计 量估计要好一些! 三、分别比率估计与联合比率估计的比较 具体情况分析参看教材P87 §3.4 回归估计量及其性质 与比估计相似,将回归估计的思想和技术用于分层随机抽样时,同样有两种方法: 一种是对每层样本分别求取回归估计量,然后对各层的回归估计量进行加权平均,此时所得的 估计量称为分别回归估计(separate regression estimator); 另一种是对两个变量先分别计算出分层简单估计量然后再对它们的分层简单估计量来构造回归估计,这时所得的估计量称为联合回归估计 (combined regression estimator). 1.分别回归估计(separate regression estimator) 总体均值 的估计: 总体总量 的估计: 当各层的回归系数为事先给定的常数时, 分别回归估计量是无偏的。 其方差为: 其中 是第h层的回归系数 并且当 时, 达到最小,即 通常 未知,可用回归系数 作为 的估计: 注 意 (1)分别回归估计量是有偏的,但当每一层的样 本量 都很大时,估计的偏倚可以忽略,其方差近 似为: (2)这里 是子总体的回归系数, 是子总体 样本的回归系数,前者是未知的,后者是可知的。 方差 的样本估计值为: 式中, 分别回归估计量要求每一层的样本量都较大,如 果这个条件得不到满足,则分别回归估计量的偏倚 可能很大,这时,采用联合回归估计量更好些。 2.联合回归估计(combined regression estimator) 总体均值 的估计: 总体总量 的估计: 式中, 分别为 的分层估计。 是无偏的,其方差为: 并且,只要β取 时, 达到最小。
文档评论(0)