3.2-2-3.3分层抽样.pptVIP

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二节 估计量及其性质 一 总体均值的估计 二 总体总量的估计 三 总体比例的估计 四 总体特征单元数的估计 一 分层抽样的定义 定义1: 层:如果一个包含N个单元的总体可分成“不重不漏”的L个子总体,则称这样的子总体为层(stratum)。 一、总体均值的估计 1、估计量的定义 一、总体均值的估计 二、总体总量的估计 1、估计量的定义 二、总体总量的估计 例1:调查某地区的家庭年收入,以居民户为抽样单元,根据经济及收入水平将居民户划分为2层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:万元): 三、总体比例的估计 1、估计量的定义 三、总体比例的估计 四、总体特征单元数的估计 1、估计量的定义 四、总体特征数的估计 例2:为调查某地电视观众观看某综艺节目的人数比例,由于市区,近郊和远郊的观众对该节目的兴趣有差别,而且调查费用也不同,因此,分为三层进行分层简单随机抽样,调查结果如下: 例3:已知L=3,n=300,考虑六种不同的样本量的分配,并计算每种分配下,总体均值估计量的方差与总费用? 一 样本量分配对精度与费用的影响 1、常数分配(平均分配) 每层抽取相同单位数组成样本,即 一 样本量分配对精度与费用的影响 2、层样本量与层方差成正比分配 一 样本量分配对精度与费用的影响 3、层样本量与层权Wh成正比分配(或比例分配) 3 比例分配 对于分层随机抽样,若样本量按比例分配,则 一 样本量分配对精度与费用的影响 4、层样本量与层单位调查费用ch成反比分配 一 样本量分配对精度与费用的影响 5、层样本量与ShWh成正比分配 一 样本量分配对精度与费用的影响 6、层样本量与ShWh/ 成正比分配 2、最优分配 1 定义 在分层随机抽样中,如何将样本量分配到各层,使得总费用给定的条件下,估计量的方差达到最小,或给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。 2、最优分配 定理1:最优分配中,固定费用C使 最小的样本量分配有 3、奈曼分配 1 定义 在最优分配中,若单位抽样的费用相等,即ch=c时,称此最优分配为奈曼分配。 例4(续例1)若n=20,对城镇居民与农村居民抽样平均每户的费用比为1:2,试求(1)城镇与农村两层比例分配与最优分配的样本量。 (2)又若不考虑费用因素,那么最优分配的结果又有何变化? 1 某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇23560户中抽取300户,在全部农村148420户中抽取250户(均按简单随机抽样进行),调查结果城镇年平均户收入为15180元,标准差为2972元;农村年平均户收入为9856元,标准差为2546元。求全市年平均户收入的估计及其90%置信度下的置信区间。 2 某企业有工人132人,技术人员92人,管理人员27人。现欲通过抽样调查去年全年平均每人请假天数,拟采用分层抽样。若已知工人请假天数的方差为36,技术人员请假天数的方差为25,管理人员请假天数的方差为9,设样本量为30,试用奈曼分配确定各层的样本量。 * * * 定义2: 分层抽样:在每一层中独立进行抽样,总的样本由各层样本组成,总体参数根据各子总体参数的估计进行汇总得到,这种抽样称为分层抽样,所得样本称为分层样本。 对于分层抽样, 对于分层随机抽样, 2、估计量的性质 性质1:对于分层样本,若 ,则 2、估计量的性质 性质2:对于分层随机样本, 性质3:对于分层随机样本, 总体均值 的置信水平为1- 的置信区间为 性质4 对于分层随机样本, 对于分层抽样, 对于分层随机抽样, 2、估计量的性质 性质1:对于分层样本,若 ,则 2、估计量的性质 性质2:对于分层随机样本, 性质3:对于分层随机样本, 总体总量值 的置信水平为1- 的置信区间为 性质4 对于分层随机样本, 15 9 7 6 12 4 8 2 20 8 6 5 9 4 12 3 8 7 10 5 600 900 1 2 10 9 8 7 6 5 4 3 2 1 样本户家庭年收入 居民户总数 层 求(1)估计该地区居民家庭总收入及该估计的标准差。 (2)以95%的置信度对总收入进行区间估计。 对于分层抽样, 对于分层随机抽样, 2、估计量的性质 性质1:对于分层样本,若 ,则 2、估计量的性质 性质2:对于分层随机样本, 性质3:对于

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档