- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
?
?
中国住户调查数据收入变量的比较
?
?
20世纪70年代末期以来的中国经济转型,使得中国社会发生了剧烈变化。为了记录这些变革并探寻其背后的成因与可能的结果,许多研究者试图借助于住户调查或田野调查,在可靠的数据信息基础上通过严谨规范的学术研究,来深化对社会转型时期各种变化的认识。中国政府在20世纪50年代就建立了城乡住户调查体系,后来曾一度中断,80年代初期得以恢复。但这些常规年度住户调查数据通常并不对研究者或公众开放。因此相关学者必须独立地去搜集相应的数据。
对于任何一次全国性的住户调查来说,在全国范围内的代表性是研究者所努力追求的。但由于种种局限,不得不承认,这一目标通常都会在某种程度上被打折扣。尽管相应的研究者都会在介绍自己的数据获取方式之后,给出一些基本的描述性统计量,然后得出结论,认为该数据具有全国代表性。但这些结论通常建立在一些非常直观的印象的基础上。而事实上,在中国这样一个幅员辽阔,不同区域、人群具有非常大的差异性的国家,获得一套具有全国代表性的数据恐怕并不是一件容易做到的事情。对抽样方法的理解、抽样执行过程中的偏差、调查员的理解及执行方式、被调查对象的配合程度等等,都有可能导致所获得样本中的偏误。更为重要的是,实践中研究者很难基于事前信息构造一个完备的抽样框,因为所能获得的事前信息通常也是非常有限的。因此,了解不同住户数据的样本特征及其代表性或偏差,对于准确理解基于这些数据的研究结果就显得非常重要。但目前似乎并没有这方面详细、系统的讨论。
除了所搜集数据中的样本人群结构特征差异,数据质量本身显然对估计结果具有更为重要的影响。对于学术研究来说,这些过程性的问题或许比最终呈现于公众的结果要有意义得多。然而,对于数据质量的评估,却缺乏广泛认可的评价标准与检验方式,尽管人们会基于自身的理解乃至想象提出各种各样的质疑。Tsai(2008)在对陕西、河北、江西和福建4个省份316个村的村干部访谈的基础上,认为81%的村干部夸大村人均收入水平,并认为这种浮夸倾向与一系列社会经济特征,如村级选举、乡政府对村的控制等相关。有必要指出的是,作者对村收入是否浮夸(inflated)的判断是建立在向村干部询问村人均纯收入的上报数和实际数的比较中得到的,但对于这些信息是否真实,作者并没有给出相应的验证方式,而只是根据作者自身的“深度访谈”确定的。这意味着,对于第三者来说,这种结论是难以验证的。尽管在少数的讨论中也会涉及数据搜集的方式,但总体上所关注的焦点仍在于研究结果本身是否合理,并且所涉及的数据也非常有限。而Gustafsson等(2014)介绍了中国常用的研究数据,但对其中的样本特征、代表性等问题也没有给出详细的讨论。
本文的讨论对象为中国社会经济问题研究中所经常使用或相应结果产生过一定社会影响的几套数据,包括CHIP(China Household Income Project,中国居民收入调查项目)、CHNS(China Health and Nutrition Survey,中国健康与营养调查)、CHFS(China Household Finance Survey,中国家庭金融调查)、CGSS(China General Social Survey,中国综合社会调查)和CFPS(China Family Panel Study,中国家庭追踪调查)。这几套数据都包含了家庭人口特征、收入和支出等方面的基本信息,因此在收入分配等相关主题的研究中都被广为使用。但从收入水平和收入分布等信息的描述来看,不同数据之间又存在着较大的差异性。本文试图从样本人群结构特征、收入与消费的关系、收入与可观测特征之间的关系3个方面讨论几套常用数据的差异性。
二、对相应住户数据的简要说明
(一)中国居民收入调查项目(CHIP)
中国居民收入调查项目分别于1988年、1995年、2002年、2007年和2013年分别进行了5次全国住户调查①。该调查主要由中外收入分配领域相关学者设计调查问卷,国家统计局的住户调查系统负责数据收集。前3轮调查中课题组的中方研究学者主要来自中国社会科学院经济所,从2007年开始则主要来自于北京师范大学中国收入分配研究院。调查住户来自于国家统计局的年度常规住户调查样本框。与国家统计局城乡分割的住户调查体制相一致,这一调查也是分城乡进行的(2002年以后则增加了流动人口样本②),其中农村通常涵盖20个省份,城镇通常包括10个省份,2007年以后城乡所涵盖的省份都为16个,调查省份的选择考虑到东中西部不同地区的覆盖性,历年调查住户数量在1.5万~2万之间。每年度的调查都是截面的,并不是基于同一个住户的连续观测,但历次调查所覆盖的地区(城市)都是大体相同的。每次调查所使用的调查问卷并不相同,基于
文档评论(0)