大数据审计(基于Python) 课件 第四章 数据预处理:清洗表格数据.pptx

大数据审计(基于Python) 课件 第四章 数据预处理:清洗表格数据.pptx

  1. 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
  2. 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  3. 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第四章数据预处理:清洗表格数据

1(数据背景2(数据清洗目录

数据背景1

数据背景在财务流程自动化的过程中,对原始数据的清洗是首要工作。业务流程中,数据一般从系统到人工,人工处理后再返回系统。原始数据一部分来自于业务人员手工制作的Excel,一部分来源于系统。手工制作的数据很难保证完全符合系统规范,一些缺漏、不规范输入、不统一的格式等都会导致脏数据的产生。从系统导出的数据一般较为全量,有很多冗余数据,为了获取到需要的数据,也需要一定的处理。

数据清洗2

内容替换df.replace()函数用于对DataFrame的值进行全局替换,比如空值、某个统一错误的数据。df[col_name

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档