第四章 分层抽样(抽样调查理论与方法-北京商学院 李平).pptVIP

第四章 分层抽样(抽样调查理论与方法-北京商学院 李平).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
得 此时总费用约为: 2、 待估的参数为总体总和 由于总体总和的分层估计可以写成 ,样本容量 n 的确定是十分容易的。 假设 为 的允许的最大方差,由于 只需将 代入有关 的一切公式,就可以得到相应的 结论,下面列出有关的结果。 对给定的各层分配额, 有: (4.39) 若记 ,则 (4.40) 若记 ,则 (4.42) 相应的Neyman最优分配: (4.41) 若记 ,则 (4.44) 若按比例分配: (4.43) §4 分层的若干技术问题 1、 单指标分层的构造方法 这一原则在理论上是无可置疑的,但在实际应用中较难 实施,看上去符合基本原则的分层手法可以有许许多多种, 究竟哪一种是最理想最合理的呢? 本章第一节介绍分层抽样时已经强调了分层时应注意的 一些问题。根据对平均数 的方差的分析,我们看到合理的 分层比起简单随机抽样来可以避开层间差异的影响而使方差 较小。因此,要使分层合理,一个基本原则是 “ 使层内差异 尽可能小 ” ——各层有自己鲜明的特色,并 “使层间差异明 显地较大 ” ——各层之间有显著不同。 前面提到根据具体的调查目的,有时可以根据地理、性 别、民族、宗教、职业等因素来分层,在多项指标问题中有 时采用聚类分析的手段进行分层。这一小节我们考虑单项指 标调查时如何分层。如果按地区、民族等因素分层则称为基 于辅助因素的分层,倘若该辅助因素与我们感兴趣的指标关 系密切,那么这样分层常获益匪浅;反之,有可能导致不合 理的分层从而引起糟糕的结果。假如我们对总体的单项指标 有所认识,最有效的方法是按这些数值来分层,具体的做法 是确定各层之间的分点。 设将总体分为 k 层,假设 与 分别为总体的最小与最 大可能值(所谓“可能”,是因为其实我们并不确切地知道), 按数值分层即为在 与 之间插上 (k-1) 分点: 如果各层抽样分配方案已定,我们设法求这些分点使得 达到最小。 考虑分配原则为比例分配,且假定各层 相当大,那么 由于: (4.45) 显然对每个总体, 是常数,因此为使 达到最小,只需要 达到最大。数学推算告诉我 们: (4.46) 公式虽然简单,但问题不少。首先要确定 k 的大小,只有 k 确定以后,(4.46)式才有意义。应该将总体分多少层在分层抽 样中是个重要的问题。k 的大小涉及到估计的精度与工作量 及费用的大小;其次 进而 是调查的指标,它们是未知 的;再者,即使 已知,解一系列(4.46)需要用到差分方程。 2、 事后分层 前面讨论的分层抽样是建立在抽样之前总体已经分好层, 但有时候这种事先分层会遇到较大困难。而我们又很想利用分 层抽样的优越之处,此时可以采用事后分层的方法。 先用简单随机抽样的方法从总体中抽取容量为 n 的样本, 然后将这些样本中的单元按某种特征分类或分层。每一层抽 取容量仍记为 ,假如通过其它途径可以得到 ,那么总体平均数 的事后分层估计为: 其中 为样本的第 h 层中的平均数。 (4.47) 事后分层的合理性是最简单不过的。既然简单随机样本 是总体的一个“惟妙惟肖”的刻划,那么按样本特征所聚的类 恰好反映了总体具有某一特色部分的层,而样本的各层恰好 可认为是来自总体相应层的简单随机样本。基于这种合理性 保留了分层的某些优点,当然由于事前分层而带来的组 织工作方面的便利则是丝毫全无。 如果 均为已知,则可计算: 而事后分层中 是个随机变量,从而 也是随机变 量,为判断 的效果,须求平均,我们不加证明给出结果 (4.48) (4.49) (4.49)式右边第一项恰好为按比例分配分层抽样时样本平均数 的方差,第二项显然是由于事后分层所引起的方差的增加

文档评论(0)

_______ + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档