抽样调查-3分层随机抽样.ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样调查-3分层随机抽样

Chap 3 分层随机抽样 §3.1 定义与符号 一、定义与符号 分层抽样示意图 §3.2 简单估计量及其性质 一、总体均值的估计 (二)估计量的性质 二、总体总量的估计 例3.1 调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民划分为4层,每层按简单随机抽样抽取10户,调查获得数据如下(单位:元),如表3.1。估计该地区居民奶制品年消费总支出及估计的标准差。 解 估计量方差和标准差样本估计值为: 例3.2 在例3.1的调查中,同时调查了居民户拥有家庭电脑的情况,获得如下数据(单位:台)如表3.2。估计该地区居民用有家庭电脑的比例及估计的标准差。 解: §3.3 比率估计量及其性质 一、分别比率估计(separate ratio estimator) 二、联合比率估计(combined ratio estimator) 例3.3 某市1996年对950家港口生产单位完成吞吐量进行了调查,1997年欲对全市港口生产单位完成吞吐量进行抽样调查。对港口生产单位按非国有(h=1)和国有(h=2)分为两层,单位数分别为800和150家,分别在两层中调查了10家、15家港口生产单位,调查数据如表3.3试估计1997年全市港口生产单位完成的吞吐量。 三、分别比估计与联合比估计的比较 概言之,当各层nh的都比较大时,各层比率Rh之间差异比较大(R-Rh≠0的一种解释),此时分别比估计要优于联合比估计; 而当某些层nh的不够大时,或者各层的比率Rh差异较小(R-Rh=0成立),还是采用联合比估计更有效些。 但分别比估计需要知道各层的子总体辅助变量信息而联合比估计只需要知道总体辅助变量的信息。 §3.4 回归估计量及其性质 一、分别回归估计(separate regression estimator) 分别回归估计量是无偏的,其方差为: 二、联合回归估计(combined regression estimator) 定义3.7 2、当回归系数未知时 当βh,β均取最优时,分别回归估计优于联合回归估计,尤其是当各层的回归系数相差较大时,分别回归估计的优越性就更加明显了。 不过判断分别回归估计量好还是联合回归估计量好,没有一条严格不变通的规则。一般来,当回归系数需要由样本估计时,如果各层的样本量不太小,而且各层的回归系数之间差异较大,采用分别回归估计比较适宜;如果各层的样本量不太,而且各层的回归系数大致相等,采用联合回归估计较为适宜;如果各层的回归系数差别不是太大,而且并不是每层的样本量都相当大,联合回归可能更保险些。 §3.5 样本量在各层的分配 一、比例分配(proportional allocation) 二、最优分配 证明:柯西许瓦兹不等式 (1)研究目的:在给定方差V的情况下,使得费用最小 (2)研究目的:给定费用C 使得方差最小 (二)奈曼最优分配(Neyman 1934 Tschuprow1923 楚波罗) 例3.4 某市共有甲乙两个地区,现要进行家庭收入的调查。令n=500,已知甲地区共有20000户居民,乙地区共有50000户居民;甲地居民和乙地居民年收入标准差估计分别为2500和2000,同时对甲地和乙地抽样的平均每户费用之比为2:3,请分别计算在甲地和乙地进行比例分配、一般最优分配(考虑费用因素)以及奈曼分配(不考虑费用因素)的样本量。 (三)某些层要求大于100%抽样的修正 如此重复,直至样本量不超过该层总数。 解(1) §3.6 总样本量的确定 一、估计总体均值时样本量的确定 (1) 这意味着分别比估计优于联合比估计。 即 二者相当 (2) 即 各层的Y对X回归系数B 重要的是结论(2) 当每层比率Rh等于(或近似等于)层内回归系数Bh时,分别 比估计优于联合比估计。而要使得Rh= Bh,前提是一研究的 主变量与辅助变量存在强线性关系;二是各层的样本容量nh 比较大。 显然一般比估计有效都要求前提一成立。 因此前提二有实质讨论意义。 见§2.3 定义3.6 (3.60,3.61) (3.62,3.64) 1、当各层的回归系数βh为事先给定常数时 (3.65) 且当 (3.75) 类似定理2.9 2、当各层的回归系数βh未知时,用样本回归系数 bh估计它 (3.76) 该估计是有偏的,此时回归估计量方差近似值 (3.77)即最小方差 (3.78) 类同定理2.11 (3.83) (3.86) 1、当回归系数是事先给定的 则该联合回归估计是无偏的,方差分别为 (3.91) 无偏性显然,我们证明(3.91) (3.97) 并且,只要取β为 (3.99) (3.1

文档评论(0)

liangyuehong + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档