2015年家庭金融调查数据处理与存储.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2015年家庭金融数据使用说明-补充

⼀、数据清理

1、清理过程

数据回来后,会对所有数据进行初步处理,主要处理包括:删除由于访员严重

臆答、的无效样本,删除无效变量,删除敏感数据;校正人为导致的重复样本编号,校

正访员主动报备的人为误操作;合并和新访数据,拆分家庭和个人数据,拆分多选;加

注,加注问卷类型;清理备注和其他选项,数值题插值及相关规则确定等。

经过初步处理后数据生成可使用的版本。在数据使用过程中如再发现极值或异常值,中

心会进行二次核查确认。如果没有,则通过创建模型处理极值和异常值,从而更新

数据版本并告知用户。

2、数据

数据清理结束,生成的家庭金融数据在以下3个数据集里面。

1.数据集文件名中含有“hh”,代表问卷中家庭部分的数据,例如:资产与负债,家庭的支

出与收入,金融知识、基层治理与评价等;

2.数据集文件名中含有“ind”,代表问卷中个人部分的数据,例如:人口统计特征(部分),

个人工作及收入信息,与保障,家庭成员教育等;

3.数据集文件名中含有“master”,代表是地区数据,具体包括的省份信息和每次

数据的权重变量。

除此之外原始数据使用格式对应为dta格式(可用stata13.0【最佳版】或以上版本打开)。

二、变量命名规则

家庭金融问卷数据的变量名由首位的字母及后面四位数字构成,不同的首字母对应

问卷的不同部分(如,b-农业/工商业;d-金融资产),一些特别的标识性变量(id变量、城

乡、省份等)则根据它们的含义被重新命名以便使用。部分变量在原变量名后加上后缀字母

2015年‑补充

一、一、

1、清理过程

数据回来后,会对所有数据进行初步处理,主要处理包括:删除由于访员严

重,删除无效变量,删除敏感数据;校正人为导致的重复样本编号,校校;合并和新访

数据,拆分家庭和个人数据,拆分多选;加,加注问卷类型,加注问卷类型;清理备注和其

他选项,数值题插值及相关规则确定等。

经过初步处理后数据生成可使用的版本。在数据使用过程中如再发现极值或异常值,

中,则通过创建模型处理极值和异常值,从而更新,从而更新

2、数据

数据清理结束,生成的家庭金融数据在以下3个数据集里面。

1。数据集文件名中含有“hh”,代表问卷中家庭部分的数据,例如:资产与负债,家庭

的支,金融知识、基层治理与评价等,金融知识、基层治理与评价等;

2。数据集文件名中含有“ind”,代表问卷中个人部分的数据,例如:人口统计特征

(部分),个人工作及收入信息,与保障,家庭成员教育等;

3。数据集文件名中含有“主”,代表是地区数据,具体包括的省份信息和每次

具体包括的省份信息和每次

除此之外原始数据使用格式对应为dta格式(可用stata13.0【最佳版】)。

二、二、

家庭金融问卷数据的变量名由首位的字母及后面四位数字构成,不同的首字母对

应(如,b‑农业/工商业;d‑金融资产),一些特别的标识性变量(id变量、城乡、省份

等)则根据它们的含义被重新命名以便使用。部分变量在原变量名后加上后缀字母

it,表示对

文档评论(0)

187****2251 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档