- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
China Family Panel Studies
中国家庭动态跟踪调查
CFPS 技术报告系列: CFPS-1
系列编辑:谢宇 责任编辑:胡婧炜
中国家庭动态跟踪调查
抽样设计
谢宇 邱泽奇 吕萍
2012.12.20
调查对象和目标样本量
CFPS 调查的对象为中国 (不含香港、 澳门、台湾以及新疆维吾尔自治区、 西藏自治区、
青海省、内蒙古自治区、宁夏回族自治区、海南省)
25 个省 /市 /自治区的满足项目访问条件
的家户和样本家户中满足项目访问条件的家庭成员。在
2010 年的基线调查中,居住在传统
居民住宅内的、 家中至少有一人拥有中国国籍的一个独立经济单元,
便可视为一个满足项目
访问条件的家户 。 1 满足项目访问条件的家庭成员则指样本家户中经济上联系在一起的:
A. 与该家庭有血缘 /婚姻 /领养关系的直系亲属;
B.与该家庭有血缘 /婚姻 /领养关系且居住满
3
个月的非直系亲属; C.与该家庭没有血缘 /婚姻 /领养关系但居住满
6 个月的其他成员。
CFPS 样本所在的 25 个省 /市 /自治区的人口覆盖了中国除香港、澳门、台湾外总人口数
的 94.5%,由于覆盖范围如此广泛,因此可以将
CFPS 样本视为一个全国代表性样本。
CFPS 重点关注中国社会经济、教育、家庭、人口和健康等方面的变迁,为了更好的了
解这一点, 不仅需要从宏观层面上把握中国的整体变迁,
还需要在微观层面上了解中国的几
个典型省 /市的在这些方面的变化状况。因此,在抽样设计上,我们首先将全国
25 个省 /市 /
自治区分成两类: 一类省市为在省级层次的推断样本,
用以满足省级推断的要求。
我们选择
了 5 个省 /市,分别为辽宁、上海、河南、广东、甘肃,也称为大样本省(以下简称为“大
省”)。二类省市为上述 5 个省 / 市外的 20 个省 /市 /自治区,这一类省市的样本量不能够在省
级层次进行推断,也称小样本省
(以下简称为 “小省”)。从这两类样本数据的加权可以得到
对 25 个省 /市 /自治区总体的有效估计, 进而用来推断全国。 25 个省 /市 /自治区的分类见表
1。
表 1.
全国 25 个省市的分类
类型
省市自治区
上海市
一类省市(自我
辽宁省
代表省市,
河南省
“大省”)
甘肃省
广东省
二类省市(非自 江苏省、浙江省、福建省、江西省、安徽省、山东省、河北省、山西省、
我代表省市, 吉林省、黑龙江省、广西壮族自治区、湖北省、湖南省、四川省、贵州
“小省”) 省、云南省、天津市、北京市、重庆市、陕西省
1 最初我们还要求受访家庭户中至少有一名成员在抽样社区居住时间满 6 个月,但在执行过程中,这一条
件被取消,实际被这一条件过滤掉的仅有极少数家户。
1
由上,本次基线调查共有 6 个子总体,即 5 个“大省”和 其它“小省” 。根据中国和
世界上一些大型的抽样调查的经验及 2008、2009 年对北京市、上海市、广东省三个省市预
调查的经验, 在考虑调查经费和估计量精度的基础上, 确定两类省市的样本量: 5 个“大省”
的目标样本量分别是 1600 户,“小省”的目标样本量总共是 8000 户,共 16000 户。
抽样设计总原则
CFPS 样本是一个采用内隐分层( implicit stratification )方法抽取的多阶段等概率样本
multi-stage probability sample)。采用多阶段抽样设计既是为了减少调查的运作成本,也
是考虑到中国社会的社会背景差异。CFPS 中的每个子样本都通过三个阶段抽取得到。
抽样过程中的前两个阶段使用官方的行政区划资料。中国的行政区划结构有两个重要
特征:首先它是严格分等级的;其次,它覆盖了中国所有人口。由于上海不同于其它“大
省”,所以,上海样本的抽取被作为特例处理。
因为中国的经济发展一直存在地理上的差异,所以抽样设计中需要着重强调的就是地
理代表性( geographic representation)。通过内隐分层,可以确保样本很好地代表了这 25 个
省份。 而且,在每个省份中,省会城市作为隐含分层被挑选出来。 当城乡差异存在且有意义
时,城–乡区别总是被用来进行多阶段的区域层次上的隐含分层。 一般地,区、街道办事处、
或居委会指的是城市地区;相应地,县、乡镇或者村则指的是农村地区。除城–乡区别外,
一个用于测量社会经济地位( SES)的连续变量也被用于进行内隐分层。根据数据的可获得
性,所选用的排序变量依次为地方人均 GDP、非农人口比例或人口密度。
第三个阶段在入选的样本村 /居中,利用村级调查地图得到的住户列表清单制作末端抽
样框, 按照随机起点的循环等距抽样方式, 以扩大样本量的方法抽取
文档评论(0)