网站大量收购独家精品文档,联系QQ:2885784924

抽样设计和样本抽选 - unicef mics.doc

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样设计和样本抽选 - unicef mics

抽样设计和样本抽选 确定样本量 2 计算样本量 5 界定和选择用于计算样本量的核心指标 6 使用样本量表格 8 使用样本量计算公式 10 使用变形的样本量公式 13 确定初级抽样单元的个数和集群规模 — 举例说明 13 确定使用什么样本 15 使用现有样本 — 方案1 16 为新样本开发抽样框 18 恰当的概率抽样设计和抽样框 18 人口普查抽样框以及何时必需进行更新 21 使用新样本和进行抽样设计 22 标准细分区域的设计 — 方案2 24 改造的细分区域设计 — 方案3 26 简化的设计 — 不建议使用 29 如何绘制地图、拆分区域和编制住户列表 30 创建细分区域 — 抽样方案2和3 31 针对MICS4样本的其他主题 35 估计变化和分组分析 37 水和厕所指标 38 加权和计算抽样误差 39 样本加权 39 计算抽样误差 40 样本抽选的技术细节 42 PPS抽样的过程 — 方案2 42 PPS抽样的过程 — 方案 3 44 国家案例 46 黎巴嫩案例 46 莫桑比克案例 52 抽样设计和样本抽选 本章专业性较强,主要针对抽样人员,但同时也可供调查协调员和其他技术专家使用。本章内容将帮助您: 确定样本量 判断现有的样本是否可用,或者为新样本确定合适的抽样框 为新样本进行抽样设计 在以下方面有所认知:如果要求分地区的估计值以及水和厕所的估计值 有代表性,其中所涉及到的样本量、估计值可靠性和调查成本 进一步熟悉加权、估计和抽样误差 了解pps(与规模成比例)抽样和潜在分层 了解两个不同国家的抽样设计 多指标类集调查(MICS)是一个抽样调查,而不是对整个目标总体来采集数据。调查中会涉及到多种调查对象:住户、15-49岁妇女、5岁以下儿童,或其他年龄段的人群。但是,被访者通常是调查户中孩子的母亲或者看护人。需要注意的是,第四轮多指标类集调查(MICS4)是一个全国性调查,需要从全国所有住户中进行抽样,而不仅仅是抽取有低龄儿童或育龄妇女的住户。 确定样本量 样本量是样本设计中最重要的因素,因为相对于其他因素,它对调查精度、成本和调查时长的影响更大。样本量取决于可用的资金以及对精度的要求。而后者,也就是对精度的要求,还需要考虑到估计值是只需要具有全国代表性,还是也要有分地区代表性。并且,总的样本量也与样本区域(初级抽样单位PSU)的数量以及最终集群的规模有关。因此,虽然可以借助数学公式来计算样本量,但是在确定样本量时也需考虑上述各种因素。 获取帮助 虽然本章内容比较详尽,但是并不是将读者只定位于专门的抽样统计学家。样本设计中很多方面都可能需要从国家统计部门内部或是统计部门以外来获取帮助。这些方面可能包括:测算样本量、构造抽样框、对多个可选的样本设计方案进行评估、运用pps抽样方法、权数计算,以及估计抽样误差。无论如何,我们都强烈建议您在样本设计阶段能得到国家统计部门的建议。 在确定初级抽样单位(PSU)个数和集群规模时有两条一般性的经验规则:PSU个数越多越好,因为这样有助于提高地域代表性亦即覆盖面,也有助于提高可靠性;集群规模则是越小越好,这样估计值将更加可靠。 例子: 在一个全国性调查中,一个600个PSU、集群规模为10户的样本和一个400个PSU、集群规模为15户的样本虽然样本量都是6,000户,但是前者可以得到更为可靠的估计结果。并且,集群规模为10户优于集群规模为15户,因为集群规模越小,调查的可靠性越高。总之,在其他因素相同的前提下,我们应该尽量增加PSU个数,同时减少集群规模。 一般来说,抽取的PSU越多,调查效果越好。但是,PSU个数的确定在很大程度上会受制于成本考虑、以及是否需要估计值分地区具有代表性(估计值的分地区代表性将在后面的章节中介绍)。交通成本是一个重要因素。如果PSU之间相距较远,且同一个调查队需要从一个地方到另一个地方开展调查(假设不是在每个PSU都聘用当地访问员),那么减少PSU个数将会显著降低整体调查成本。相反地,如果调查要求估计值具有分地区代表性,则往往不得不增加而非减少PSU个数。 集群规模是在确定样本量时需要考虑的另一个因素。它的影响可以通过样本设计效应即deff来度量。 样本设计效应deff是在样本量相同的情况下,实际的分层集群调查样本(在此例中为第四轮多指标类集调查)的抽样方差和简单随机样本 的抽样方差的比值。比如,如果调查中某个指标的deff计算值为2.0,就说明当样本量相同时,该调查估计值的抽样方差是简单随机抽样的两倍。之所以说小集群比大集群更为可靠,是因为deff值会随着集群中住户数的增加而增加。 本章节末尾讲到样本量时,会给出几个确定PSU个数和集群规模的具体例子。 简单随机取样由于成本较高,通常不在第四轮多指标类集调查(MICS4)以及其他住户调查中采

您可能关注的文档

文档评论(0)

wujianz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档