财务大数据清洗(上)
数据准备将四个分部的数据整理到一个excel表中迅驰商贸有限公司提交了2020-2021年三年的销售数据但在整理中发现几个分部中有些数据有问题,也有一些记录重复北京分部上海分部深圳分部长沙分部这些脏数据对数据分析会产生影响,进而影响经营决策
数据准备完成各分部数据汇总脏数据的清洗第一步:数据的读入
数据准备第二步:数据汇总先使用concat函数完成数据合并在命令行中录入命令,执行效果:第一条出库号277有重复且没有数据图中出库号282、287还有其他问题
重复行查询与清理1重复行查询Pandas中查询重复数据方法使用duplicated函数,命令格式为:duplicate
您可能关注的文档
最近下载
- 市政工程道路水泥混凝土面层施工技术交底.docx VIP
- 临床药物治疗学(1).pdf VIP
- 现金流量表自动生成模板.xls VIP
- 2025年智慧树知到《军事理论》考试题库及答案解析.docx VIP
- 《软件设计与体系结构》期末考试试卷及答案.doc VIP
- 新22D3 电力线路敷设安装建筑工程图集.pdf VIP
- 人工智能行业市场前景及投资研究报告:CPU,Agentic AI重塑通用计算价值.pdf VIP
- DBJT15-226-2021 民用建筑电线电缆防火技术规程.pdf VIP
- 河南科技大学《软件设计与体系结构》2021-2022学年期末试卷.doc VIP
- 《中华人民共和国农村集体经济组织法》专业解读课件.pptx VIP
原创力文档

文档评论(0)