- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
China Family Panel Studies
CFPS 中国家庭动态跟踪调查
技术报告系列:CFPS-13
系列编辑:谢宇 责任编辑:胡婧炜
中国家庭动态跟踪调查
2010 年综合变量(3):年龄、婚姻最佳变量
张春泥 许琪 孙妍
2012.12.20
CFPS 2010 个人问卷设计的一大优势是采用回顾 (retrospective )的方式收集了受访者
生命历程中重要事件 (如教育、婚姻)的起止时间,这一设计满足了社会科学领域对事件史
数据日益增长的需求,尤其是CFPS 的婚姻史模块,详尽询问了受访者经历各种婚姻变化的
时间,弥补了同类数据在这一领域的空白,为专门研究婚姻及婚姻与其他事件关系的研究者
提供了数据。但是,这一设计对记录事件发生时间的准确性提出了要求。由于2010 年是以
回顾的方式收集婚姻事件的时间,所以受访者的记忆偏差导致数据中出现了时间的逻辑顺序
不合理、同一信息不同来源填答不一致等问题。在数据采集结束后,CFPS 数据团队对数据
填答的质量进行了评估,并对个别常用的时间变量做了后期更正。为了保持原始填答,我们
通过额外生成最佳变量(X_best )的方式来保存更改后的取值。由于时间和人力有限,我们
仅就成人库的出生年、初婚结婚时间、初婚配偶出生年份、婚姻状态生成了最佳变量。在
2012 年的调查中,我们还会对这些重要变量的已有填答进行确认,并会在日后的数据发布
中更新最佳变量。
1. 问题描述
1.1 受访者的出生年在不同问卷中填答不一致
成人受访者的出生年信息有三个来源:一是家庭成员问卷以代答的方式询问了家中每一
位成员的出生年 (tb1y_a_p ),若受访者不记得具体出生年,则用调查年与填报的年龄
(tb1b_a_p )相减,或根据填报的属相 (tb1a_a_p )计算对应的出生年;二是受访者在填答
成人问卷时填报的出生年 (qa1y );三是该受访者的配偶在填答配偶出生年时填报的受访者
的出生年 (qe606y 或qe210y )。理论上,对同一个受访者的出生年,这三个来源的填答应该
一致,但由于家庭成员问卷、受访者的个人问卷、受访者配偶的个人问卷是由不同的人填答
的,CAPI 系统未设计对不同问卷的填答的一致性及逻辑性检查,因此,出生年变量仍存在
缺失、各来源填答不一致 (见表 1)、填答的出生年与其他生命事件(如婚姻)在时间上的
逻辑关系不合理等问题。
1
表1. 受访者出生年在不同问卷中填答不一致的样本数(N= 33,600 )
频数
个人问卷自答出生年不等于家庭成员问卷代答的出生年 983
其中,填答相差在3 岁以上 249
个人问卷自答出生年不等于初婚/现任配偶填答的配偶出生年 1,645
其中,填答相差在3 岁以上 511
注:表中的统计不包括相关变量含缺失值的样本,下同。
1.2 受访者本人填答的初婚年份与初婚配偶填答的初婚年份不一致
如果受访者及其配偶均为初婚,且两人均有个人问卷,在将受访者与其配偶的数据匹配
后,二人各自填答的初婚的年份 (qe605y )应一致。但我们发现,仍有相当数量的初婚夫妻
填答的初婚年份不一致。不一致的原因有两种:一、由于T2 表代码错误所造成的夫妻匹配
错误,即T2 表中填答的受访者配偶并非其配偶,而是其他家庭成员;二、由于记忆错误
原创力文档


文档评论(0)