第四章分层随机抽样.pptxVIP

下载本文档

31
0
约3.06千字
约 63页
2021-09-24 发布于河北
举报
版权申诉

第四章分层随机抽样.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第四章分层随机抽样;4.1 概述 ;4.1.2分层抽样的适用场合：（1）不仅需要估计总体参数，也需要估计各层参数。（2）便于管理，按现成的地理分布或行政划分来分层。（3）希望样本中能包含各个部分，以增加代表性。（4）把一个内部差异很大的总体分成几个内部比较相似的子总体（层）进行分层抽样，可以提高估计量的精度。如果有极端值，也可以把它们分离出来形成一层。即“层间方差大，层内方差小”。 ;4.2 简单估计量及其性质;一、分层抽样中 ;例4.２：调查某地区的居民奶制品年消费支出，以居民户为抽样单元，根据经济及收入水平将居民户分为４层，每层按简单随机抽样抽取１０户，调查数据如下，估计该地区居民奶制品年消费总支出及估计的标准差。表：样本户奶制品年消费支出;解：;（3）该地区居民奶制品年消费总支出的置信度为95%的置信区间为 ;例4.3：某市进行家庭收入调查，分城镇居民及农村居民两部分抽样，在全部城镇居民23560户中随机抽取300户，在全部农村居民148420户中随机抽取250户，调查结果是城镇年平均户收入为15180元，标准差为2972元；农村年平均户收入为9856元，标准差为2546元。求全市年平均户收入的置信度为90%的置信区间。解：;3、分层随机抽样中，总体比例P的简单估计 ;估计的性质（1）（2） ;例：在某行业技术人员中，按年龄分层，调查会使用计算机者所占的比例。数据如下：试估计总体中会计算机者占的比例。;解：;4.3 各层样本量的分配;1.比例分配：指按各层层权（各层单元数占总体单元数的比例）进行分配。;例：假设某公司欲估计某类产品的用户的每年平均支出。企划人员拟就整个潜在用户的名单，共8000户。采用分层随机抽样抽取样本200户，求按比例分配时各层样本量。;例. 某电视台要在某地区的住户中,调查该台的晚间新闻的收视率。该地区包括3个县,共有67401家住户。假定该电视台采用分层随机抽样分别从三个县抽取住户，样本量为1500。每个县的总户数以及抽样数据列表如下： ? 求该地区新闻收视率的95%的置信区间。;解：分层随机抽样时，收视率P的估计为： ;收视率P的置信度为95%的近似置信区间为：即有95%的把握可以认为，该地区的新闻收视率在22.1%～26.5%之间。 ;2.最优分配：; ;例.在例4.3中，样本量仍为n=550。城镇居民23560户，农村居民148420户。城镇居民与农村居民的年收入的标准差分别为S1=3000元,S2=2500元。对城镇居民与农村居民抽样平均每户的费用比为1：2，试求城镇与农村两层比例分配与最优分配的样本量。又若不考虑费用因素，那么最优分配的结果如何？;例3.２：调查某地区的居民奶制品年消费支出，以居民户为抽样单元，根据经济及收入水平将居民户分为４层，每层按简单随机抽样抽取１０户，调查数据如下，估计该地区居民奶制品年消费总支出及估计的标准差。表：样本户奶制品年消费支出;解：按比例分配时，对于Neyman分配，;4.4 样本总量的确定;证明：;* ;例：某地区采用按比例分层随机抽样对养猪场的调查，根据养猪场的规模大小分为大、中、小三层。已知上次调查的资料如下：某地区采用按比例分层随机抽样对养猪场的调查，根据养猪场的规模大小分为大、中、小三层。已知上次调查的资料如下：估计该地区生猪存栏总数的精度要求为以95%的置信度，相对误差为10%，试确定这次调查的总样本量以及各层样本量。 ;解：;例：某流水线生产了1500件产品，为估计产品的合格率，将产品按早、中、晚班分成三层。各班产量分别为：早班550件，中班500件，晚班450件。根据以往的情况，每班合格率均在95%左右。若要求以95%的把握使估计量的绝对误差不超过2%，分别确定按比例配置和按Neyman配置时总样本量和各层样本量。解：;例：（续例3.2）如果要求在置信度95%下，相对误差不超过10%，则按比例分配和Neyman分配时，总样本量分别为多少？解：;3.在估计总体均值时，若总费用给定，精度最高时，样本总量n的确定公式： ;4.5 分层时的若干问题;（2）最优分配（以Neyman为例）与比例分配在精度上的比较：理论上讲，最优分配的精度应高于相同样本量的任何其他分配。当然，也高于比例分配的精度。但最优分配在精度上的改进有多大呢？ ;*最优分配对于估计总体比例P的情形较少使用。　（除非Ｐ特别小或特别大） ;2.层的划分：（１）层的划分原则： a. 一种原则是仅为满足估计部分（即子总体）参数的需要