- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四节分层随机抽样
例.在例4.3中,样本量仍为n=550。 城镇居民23560户,农村居民148420户。 城镇居民与农村居民的年收入的标准差分别为S1=3000元,S2=2500元。 对城镇居民与农村居民抽样平均每户的费用比为1:2, 试求城镇与农村两层比例分配与最优分配的样本量。 又若不考虑费用因素,那么最优分配的结果如何? 例3.2:调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户分为4层,每层按简单随机抽样抽取10户,调查数据如下,估计该地区居民奶制品年消费总支出及估计的标准差。表:样本户奶制品年消费支出 层 居民户总数 样本户奶制品年消费支出 1 2 3 4 5 6 7 8 9 10 1 200 10 40 0 110 15 10 40 80 90 0 2 400 50 130 60 80 100 55 160 85 160 170 3 750 180 260 110 0 140 60 200 180 300 220 4 1500 50 35 15 0 20 30 25 10 30 25 解:按比例分配时, 对于Neyman分配, 4.4 样本总量的确定 1.在分层随机抽样中,影响样本总量n的因素: (1)只讨论对总体参数的精度要求; (2)样本量的分配形式。 2.在估计总体均值时,若精度要求给定,样本总量n的确定公式: 证明: * 例:某地区采用按比例分层随机抽样对养猪场的调查,根据养猪场的规模大小分为大、中、小三层。已知上次调查的资料如下:某地区采用按比例分层随机抽样对养猪场的调查,根据养猪场的规模大小分为大、中、小三层。已知上次调查的资料如下: 估计该地区生猪存栏总数的精度要求为以95%的置信度,相对误差为10%,试确定这次调查的总样本量以及各层样本量。 层(h) Nh 第h层样本均值 第h层样本方差 1 2 3 432 546 322 43.2 26.5 13 170.11 69.92 20.23 总计 1300 解: 例:某流水线生产了1500件产品,为估计产品的合格率,将产品按早、中、晚班分成三层。各班产量分别为:早班550件,中班500件,晚班450件。根据以往的情况,每班合格率均在95%左右。若要求以95%的把握使估计量的绝对误差不超过2%,分别确定按比例配置和按Neyman配置时总样本量和各层样本量。 解: 例: (续例3.2)如果要求在置信度95%下,相对误差不超过10%,则按比例分配和Neyman分配时,总样本量分别为多少? 解: 3.在估计总体均值时,若总费用给定,精度最高时,样本总量n的确定公式: 4.5 分层时的若干问题 1.抽样效果分析: (1)分层随机抽样与简单随机抽样的比较: 在相同的样本量下,比较二者的估计量的方差的大小。分层随机抽样以比例分配为代表。 (2)最优分配(以Neyman为例)与比例分配在精度上的比较: 理论上讲,最优分配的精度应高于相同样本量的任何其他分配。 当然,也高于比例分配的精度。 但最优分配在精度上的改进有多大呢? *最优分配对于估计总体比例P的情形较少使用。 (除非P特别小或特别大) 2.层的划分: (1)层的划分原则: a. 一种原则是仅为满足估计部分(即子总体)参数的需要或为了组织实施的便利。 b.另一种原则是尽可能提高抽样精度,减少估计量的方差。需要选择恰当的变量变量作为分层标志。 分层标志的选择:可以是调查指标的前期值 可以是与调查指标有较大线性相关的指标。例如交通运输量的调查中,车辆的吨位是与其两个主要指标:运量与周转量密切相关的。 (2)层权对估计量的影响: (3)最优分层如何确定各层的分点:下面介绍一种确定层界的快速近似法——累积平方根法。 它是由Dalenius和Hodges提出的。 其做法:将分层变量的分布的累积平方根进行等分来获得最优分层,所以成为累积平方根法。 例:某地区电信部门在对利用电话上网的居民家庭安装ADSL意愿进行调查时,以辖区内最近三个月有电话上网支出的居民用户为总体(上网电话费为0.02元/分钟),并准备按上网电话费支出(记为x)进行分层,试确定各层的分点。 居民家庭上网电话费支出分布 范围x 频数f 累积 0~5 65328 255.5934 255.5934 5~10
文档评论(0)