大数据技术与应用基础课件:财务大数据清洗(中).pptx

大数据技术与应用基础课件:财务大数据清洗(中).pptx

财务大数据清洗(上)

数据准备将四个分部的数据整理到一个excel表中迅驰商贸有限公司提交了2020-2021年三年的销售数据但在整理中发现几个分部中有些数据有问题,也有一些记录重复北京分部上海分部深圳分部长沙分部这些脏数据对数据分析会产生影响,进而影响经营决策

数据准备完成各分部数据汇总脏数据的清洗第一步:数据的读入

数据准备第二步:数据汇总先使用concat函数完成数据合并在命令行中录入命令,执行效果:第一条出库号277有重复且没有数据图中出库号282、287还有其他问题

重复行查询与清理1重复行查询Pandas中查询重复数据方法使用duplicated函数,命令格式为:duplicate

文档评论(0)

1亿VIP精品文档

相关文档