样本地区和样本个体的抽取方法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
样本地区和样本个体的抽取方法

PAGE 1 PAGE 10 附件二: 国家卫生服务总调查样本地区和样本个体的抽取方法 一、概 述 1.1 国家卫生服务总调查抽查的原则是既要兼顾调查设计的科学性即样本地区和样本个体对全国和不同类型地区有足够的代表性,又不致于过多增加样本量而加大调查的工作量,即经济有效的原则。 1.2 抽样的方法是多阶段分层整群随机抽样法。第一阶段分层是以县(市或市区)为样本地区;第二阶段分层是以乡镇(街道)为样本地区;第三阶段分层以村为样本地区;最后是住户为样本个体。 二、第一阶段分层整群抽样 2.1 第一阶段抽样着重解决两个基本问题:一是由于全国各县、市差异极大,如何确定第一阶段分层的基准;二是抽样比例,多大的县、市样本量能经济有效地代表全国和不同类型的地区。 2.2 第一阶段分层基准的确定 第一阶段分层的指???是通过专家咨询法和逐步回归法筛选的10个与卫生有关的社会经济、文化教育、人口结构和健康指标。10个指标的主成份分析结果如表1。 表⒈ 主要社会经济和人口动力学指标的主成份因子模型 变 量 单位 主成份1 主成份2 主成份3  第一产业就业率 % 0.82* -0.49 0.17 14岁人口比例 % 0.80* -0.10 -0.49 文 盲 率 % 0.69* 0.32 0.22 粗 出 生 率 ‰ 0.69* 0.35 -0.10 粗 死 亡 率 ‰ 0.67* 0.51 0.33 婴儿死亡率 ‰ 0.67* 0.60* -0.02 人均工农业产值 (元) -0.65* 0.53* 0.12 第二产业就业率 % -0.84* 0.45 -0.10 初中人口比例 % -0.92* 0.02 -0.04 65 +人口比例 % -0.10 -0.19 0.93* 从主成份分析中可以看出主成份1与绝大多数变量有十分显著的关联,意义十分明确,而且代表 10 个变量整体信息的 51.22%。其值的大小可以综合反映一个地区社会经济、文化教育、人口及其健康的发展。因此,确定主成份1为分层的基准称它为分层因子。 2.3 第一阶段的聚类分层 在计算各县、市分层因子的得分后,用 K-Means聚类分析方法将总体分为组间具有异质性和组内具有同质性的五类地区即五层。聚类分层的结果第一层有 201 个县(市或市区),占整个县(市或市区)的 8.2%;第二层有 650个县(市或市区),占 26.5%;第三层有 698 个县(市或市区),占 28.5%;第四层有 691个县(市或市区),占 28.2%;第五层有 212,占 8.6%。 表⒉显示了各层因子得分和选择的社会经济等变量的均值,可见各层呈明显的梯度。可以认为,第一层所在的市县,是社会经济、文化教育和卫生事业发展以及人群健康状况好的地区,第二层是比较好的地区,第三层是一般性地区,第四层是比较差,第五层是差的地区。 表2 主要社会经济和人口动力学指标的主成份因子模型 市县 因 子 得 分 社会经济和人口动力学指标 层别 数 均 数 距 离 GNP AEP ILLIT CDR IMR 1201-2.43543210.28333015.719.75.117.52650-0.66382164.6683564.623.75.726.236980.06921655.0045083.532.46.331.446910.57761264.5734188.143.67.449.152121.7457539.6131990.066.811.7121.4 2.4 第一阶段分层等概率多种样本容量的抽样 用经济有效的样本代表总体是抽样调查的精髓。样本量的确定基于以往的

文档评论(0)

170****0532 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8015033021000003

1亿VIP精品文档

相关文档