数据清理步骤.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据清理步骤

数据清理步骤 数据合并。参见E:\jdh2010\营养\数据录入\2009CHNS数据conbined\文件合并过doc。 数据导出。存文件夹:E:\jdh2010\营养\数据录入\2009CHNS数据export 数据库 MODIFY PROJECT e:\jdh2010\营养\数据录入\tmp\项目1.pjx 住户表核查 封面(查户号有无重复) 从cspro中导出的数据名为cover.txt,将其导入数据库中e:\jdh2010\营养\数据录入\tmp\cover.dbf 建立新字段:hhid,vill。 repl all hhid with alltrim(t1)+alltrim(t2)+alltrim(t3)+alltrim(t4)+alltrim(t5) repl all vill with alltrim(t1)+alltrim(t2)+alltrim(t3)+alltrim(t4) 整理出:COPY TO e:\jdh2010\营养\数据录入\数据清理\村及户数名单.xls TYPE XL5 住户表1名单列表(整理出供相互比对的性别,出生日期) 从cspro中导出的数据名为old.txt,将其导入数据库中e:\jdh2010\营养\数据录入\tmp\old.dbf 字段名变更:aa1,aa2,aa3w(N,8),aa3l(N,8),a5e(N,1) 建立新字段:vill(C,6),hhid(C,9),line(C,12),birth(N,8),calender(1阳历,2阴历,N,1)。 repl all line with alltrim(t1)+alltrim(t2)+alltrim(t3)+alltrim(t4)+alltrim(t5) +alltrim(aa1) repl all birth with aa3w for aa3w0 repl all birth with aa3l for aa3l0 repl all calender with 1 for aa3w0 repl all calender with 2 for aa3l0 将hhid,vill,line,birth,calender,aa1导出为COPY TO e:\jdh2010\营养\数据录入\tmp\list1.dbf APPEND FROM e:\jdh2010\营养\数据录入\tmp\list2.dbf(见下文) 从cspro中导出的数据名为new.txt,将其导入数据库中e:\jdh2010\营养\数据录入\tmp\new.dbf 字段名变更:aa1,aa2,aa3w(N,8),aa3l(N,8),a5e(N,1) 建立新字段:vill(C,6),hhid(C,9),line(C,12),birth(N,8),calender(1阳历,2阴历,N,1)。 将hhid,vill,line,birth,calender,aa1导出为COPY TO e:\jdh2010\营养\数据录入\tmp\list2.dbf 成人表 ①查连接码缺失者清单,成人表、儿童表的数量。 从cspro中导出的数据名为cover.txt,将其导入数据库中e:\jdh2010\营养\数据录入\tmp\cover.dbf 建立新字段: line(C,12)→(N,12)。 repl all line with alltrim(t1)+alltrim(t2)+alltrim(t3)+alltrim(t4)+alltrim(t5) +alltrim(a1) 连接码是否异常 SELECT Indco.line, Indco.t0; FROM 数据1!indco; ORDER BY Indco.t0 DESC COPY TO e:\jdh2010\营养\数据录入\数据清理\连接码错.xls TYPE XL5 ②日前的婚姻状况 从cspro中导出的数据名为idemo.txt,将其导入数据库中e:\jdh2010\营养\数据录入\tmp\idemo.dbf 建立新字段: line(C,12)→(N,12)。 变更字段属性:a8(C,2)→(N,2) SELECT Idemo.line, Idemo.a8; FROM 数据1!idemo; WHERE Idemo.a8 4; ORDER BY Idemo.line DESC COPY TO e:\jdh2010\营养\数据录入\数据清理\婚姻状况.xls TYPE XL5 膳食表1 ①操作员编号错误 打开从cspro中导出的数据名为diet1_2.txt,浏览,发现: ②有无重复的户号 从cspro中导出的数据名为diet1_2.txt,将其导入数据库中e

文档评论(0)

tmd2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档