第四章分层抽样(抽样调查理论与方法-北京商学院,李平).pptVIP

  • 78
  • 0
  • 约1.01万字
  • 约 51页
  • 2017-10-02 发布于广东
  • 举报

第四章分层抽样(抽样调查理论与方法-北京商学院,李平).ppt

第四章分层抽样(抽样调查理论与方法-北京商学院,李平)

得 此时总费用约为: 2、 待估的参数为总体总和 由于总体总和的分层估计可以写成 ,样本容量 n 的确定是十分容易的。 假设 为 的允许的最大方差,由于 只需将 代入有关 的一切公式,就可以得到相应的 结论,下面列出有关的结果。 对给定的各层分配额, 有: (4.39) 若记 ,则 (4.40) 若记 ,则 (4.42) 相应的Neyman最优分配: (4.41) 若记 ,则 (4.44) 若按比例分配: (4.43) §4 分层的若干技术问题 1、 单指标分层的构造方法 这一原则在理论上是无可置疑的,但在实际应用中较难 实施,看上去符合基本原则的分层手法可以有许许多多种, 究竟哪一种是最理想最合理的呢? 本章第一节介绍分层抽样时已经强调了分层时应注意的 一些问题。根据对平均数 的方差的分析,我们看到合理的 分层比起简单随机抽样来可以避开层间差异的影响而使方差 较小。因此,要使分层合理,一个基本原则是 “ 使层内差异 尽可能小 ” ——各层有自己鲜明的特色,并 “使层间差异明 显地较大 ” ——各层之间有显著不同。 前面提到根据具体的调查目的,有时可以根据地理、性 别、民族、宗教、职业等因素来分层,在多项指标问题中有 时采用聚类分析的手段进行分层。这一小节我们考虑单项指 标调查时如何分层。如果按地区、民族等因素分层则称为基 于辅助因素的分层,倘若该辅助因素与我们感兴趣的指标关 系密切,那么这样分层常获益匪浅;反之,有可能导致不合 理的分层从而引起糟糕的结果。假如我们对总体的单项指标 有所认识,最有效的方法是按这些数值来分层,具体的做法 是确定各层之间的分点。 设将总体分为 k 层,假设 与 分别为总体的最小与最 大可能值(所谓“可能”,是因为其实我们并不确切地知道), 按数值分层即为在 与 之间插上 (k-1) 分点: 如果各层抽样分配方案已定,我们设法求这些分点使得 达到最小。 考虑分配原则为比例分配,且假定各层 相当大,那么 由于: (4.45) 显然对每个总体, 是常数,因此为使 达到最小,只需要 达到最大。数学推算告诉我 们: (4.46) 公式虽然简单,但问题不少。首先要确定 k 的大小,只有 k 确定以后,(4.46)式才有意义。应该将总体分多少层在分层抽 样中是个重要的问题。k 的大小涉及到估计的精度与工作量 及费用的大小;其次 进而 是调查的指标,它们是未知 的;再者,即使 已知,解一系列(4.46)需要用到差分方程。 2、 事后分层 前面讨论的分层抽样是建立在抽样之前总体已经分好层, 但有时候这种事先分层会遇到较大困难。而我们又很想利用分 层抽样的优越之处,此时可以采用事后分层的方法。 先用简单随机抽样的方法从总体中抽取容量为 n 的样本, 然后将这些样本中的单元按某种特征分类或分层。每一层抽 取容量仍记为 ,假如通过其它途径可以得到 ,那么总体平均数 的事后分层估计为: 其中 为样本的第 h 层中的平均数。 (4.47) 事后分层的合理性是最简单不过的。既然简单随机样本 是总体的一个“惟妙惟肖”的刻划,那么按样本特征所聚的类 恰好反映了总体具有某一特色部分的层,而样本的各层恰好 可认为是来自总体相应层的简单随机样本。基于这种合理性 保留了分层的某些优点,当然由于事前分层而带来的组 织工作方面的便利则是丝毫全无。 如果 均为已知,则可计算: 而事后分层中 是个随机变量,从而 也是随机变 量,为判断 的效果,须求平均,我们不加证明给出结果 (4.48) (4.49) (4.49)式右边第一项恰好为按比例分配分层抽样时样本平均数 的方差,第二项显然是由于事后分层所引起的方差的增加

文档评论(0)

1亿VIP精品文档

相关文档