大数据技术与应用基础课件:财务大数据清洗.pptx

大数据技术与应用基础课件:财务大数据清洗.pptx

财务大数据清洗

财务大数据清洗是发现并纠正数据文件中可识别错误的最后一道程序获取的数据是面向某一主题的数据集合这些数据从多个业务系统中抽取而来包含历史数据数据清洗检查数据一致性处理无效值和缺失值

财务大数据清洗有的数据是错误数据有的数据相互之间有冲突避免不了要按照一定的规则,把“脏数据”“洗掉”是过滤那些不符合要求的数据将过滤的结果交给业务主管部门确认是否过滤掉还是由业务单位修正之后再进行抽取

识别无效数据不符合要求的数据不完整的数据错误的数据重复的数据出现异常数据要及时发现,这是数据分析人员的职责和义务要求数据分析人员具备足够的知识与能力去识别:

识别无效数据1要了解分析对象的基本规律、基本

文档评论(0)

1亿VIP精品文档

相关文档