《抽样调查》第三章 分层随机抽样-课件.pptVIP

  • 345
  • 0
  • 约4.83千字
  • 约 62页
  • 2021-09-17 发布于新疆
  • 举报

《抽样调查》第三章 分层随机抽样-课件.ppt

总体均值与总量的估计 总体均值(总和)的估计量为样本均值(总和)的常数倍(自加权) 估计量的方差 四、最优分配 在分层随机抽样中,对于给定的费用C,能使估计量的方差V达到最小或给定估计量的方差V ,使总费用C最小的各层样本量的分配称为最优分配。 柯西不等式: 奈曼分配(若每层抽样费用都相等,即 时): 【例4】对某地区的居民豆制品年消费支出进行调查,以居民户为抽样单元,根据收入水平将居民户划分为四层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),如表3-4。样本量为n=40,则按比例分配和Neyman分配时,各层的样本量应为多少? 解:由上表知, 各层的层权及抽样比为: 各层样本均值及方差为: 同理可得: 按比例分配时,各层的样本量为: 即各层的样本量分别为3,6,10,21 对于Neyman分配,根据前面对 及 的计算结果,得到: 因此,按Neyman分配时,各层应分配的样本量为: 即各层的样本量分别为3,7,23,7。 按最优分配时,有时抽样比 较大,某个层的 又比较大,则可能出现按最优分配计算的这个层的样本量 超过 的情况。实际工作中,如果第k层出现这种情况,最优分配是对这个层进行100%抽样,即取 ,然后将剩下的样本量 按最优分配各层,直到各层样本量 都不超过该层的总体容量 为止。 下面以内曼最优分配为例,具体讲述需要进行大于100%抽样的实施步骤。 五、某些层需要进行大于100%抽样的修正 一、一般公式(估计总体均值时n的确定) 令 ,其中 已经选定,于是当方差V给定时, 第四节 样本总量的确定 得到确定样本量n的一般公式为: 如果估计精度是以误差限的形式给出,则 , 当按比例分配时, 实际工作中,n的计算可以分为两步,先计算 然后进行修正: 当按Neyman分配时, 当按最优分配时: 【例4】(续例3) 如果要求在95%置信度下,相对误差不超过10%,则按比例分配和Neyman分配时,总样本量分别为多少? 解:当按比例分配时,由前面的计算结果,可以得到各层的 在95%值信度时,对应的z=1.96。 又 因此得到: 由此可以得到: 对 进行修正,得到修正后的n: 当按Neyman分配时: 综合上述,按比例分配时,样本量至少应为179,按Neyman分配时,样本量至少应为110。 当方差V给定时,得到样本量为: 二、最优分配需要考虑费用时 在最优分配时,如果考虑费用为简单线性费用函数: 则: 而当总费用C是给定时,有: 则: 对其求和得到样本量为: 当方差V给定时,如果 都比较大,使得 则:比例分配时,总样本量为: 或: 三、总体参数为P的情形 Neyman分配时的总样本量n为: 计算样本量之前,需要对 作预估计。 【例5】(续例2) 如果要求在95%置信度下,绝对误差不超过5%,则按比例分配和Neyman分配时,总样本量分别为多少? 解:在置信度95%时,对应的z=1.96,而绝对误差d=5%,因此 按比例分配时:可以得到 调整后的样本量为: Neyman 分配时: 所以,按比例分配和按Neyman分配所需的样本量分别为206和196。 第五节 分层抽样设计效果分析 本节我们将从理论上将分层随机抽样与简单随机抽样进行效果比较,也即在相同样本量下,比较其估计量的方差大小。为比较分层随机抽样于简单随机抽样的精度,我们拟在样本量为比例分配的形式下讨论。 记简单随机抽样(对均值估计量)的方差为: 比例分配的分层随机抽样相应估计量的方差为: 一、分层随机抽样与简单随机抽样的比较 根据总体单元指标的平方和分解可得: 如果各层 都比较大,则: 因而: 上式右边第二项是层间平方和,为非负,因此有: 方差差值为: 这表明层平均数的差异愈大,分层的效果就愈好,若层平均数都相等,则分层与不分层效果相同。 结论:说明比例分配分层随机抽样的精度高于简单随机抽样,设计效果小于1. 二、分层随机抽样各种样本量分配方法之间的比较 其中: 主要针对比例分配与最优分配抽样效果进行比较分析。为此考虑比例分配方差 与 最优分配方差之差。 【结论】: 如果各层均值差异越大,则采用按比例分配的方式较好,而当各层的标准差相差很大时,则最优分配更好。实际工作中,除非各层的标准差相差很大,人们通常还是喜欢采用按比例分配的方式,这主要是因为最优分配只是针对某个指标(或变量)而言的。实际调查项目中,目标变量通常不止一个,这时,针对

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档