任务三合并及清洗数据大数据技术在财务中的应用06课件讲解.pptxVIP

  • 1
  • 0
  • 约1.31千字
  • 约 15页
  • 2026-02-03 发布于陕西
  • 举报

任务三合并及清洗数据大数据技术在财务中的应用06课件讲解.pptx

大数据技术在财务中的应用项目四数据预处理任务三合并及清洗数据授课人:边远达

任务三思维导图引入案例任务分析知识准备案例解析任务实训任务小结3.1行拼接3.2列拼接任务三合并及清洗数据

任务分析引入案例引入案例与任务分析到了月初,美菱信息有限公司财务人员小张开始对上个月企业员工的应付工资进行汇总,小王发现员工的工资数据来自两张Excel表格,分别是企业员工基本工资表.xlsx、企业员工加班工资表(位置:E:\file\),如何利用Pandas实现对这两张表进行合并呢?要想实现不同表格数据的合并和连接,就要用到Pandas模块中的concat()函数,通过这些函数实现两张表或多张表的纵向或横向连接。

数据合并:concat()函数可用于对Series数据或DataFrame数据进行行拼接或列拼接行拼接是指上下多行进行拼接,是concat()函数的默认拼接方法列拼接是指左右多列进行拼接

行拼接3.1PARTONE

一、行拼接获取资产负债表中资产部分的数据第6行代码从数据集dfReport1中获取行位置索引[14,15,30,35,60]对应的数据行。zcReport数据集包含了资产负债表中的应收票据、应收账款、存货、流动资产合计和资产总计五项数据,共5行33列。说明:

一、行拼接获取资产负债表中负债部分的数据fzReport对象中包含了流动负债合计和负债合计两项数据,共2行33列。说明:

一、行拼接获取资产负债表中负债部分的数据默认两个数据集上下拼接,适用于结构相同的数据拼接。说明:要合并的数据集对象用列表给出

行拼接3.2PARTTWO

二、列拼接有两个Excel文件,分别存储了某学校的职工工资信息和人事信息若领导想了解职工的所有信息,怎么办?提问:将这两个Excel文件的所有列拼接起来解决办法:

二、列拼接使用位于缺失值前面的数据进行填充1.指定axis=12.所有列都拼接了,“职工姓名”出现了两次说明:

为数据集添加表名标记拼接后的各个列来自于哪个表1.keys参数指定了列名的来源表,多个表名用列表形式给出2.names参数制定了列索引的名称说明:

案例解析案例分析本任务“引入案例”的解析如下:通过观察企业员工基本工资表和企业员工加班工资表,发现这两张表中有共同的列存在,因此应该使用concat()函数进行合并,其中参数:on=[工号,部门,姓名],how=outer。运行代码请打开图标“合并-案例代码.txt”注意

任务实训与任务小结任务实训请上机编写程序实现以下要求:读取工资明细表和年终奖金发放表(位置:D:\file\),根据相同的列名将工资明细表和年终奖金发放表整合到一张表里面,连接方式为左连接。通过本次学习,掌握了使用Pandas进行数据清洗与合并的核心技能。重点学习了如何通过drop_duplicates()函数处理重复数据,运用fillna()方法填补缺失值,以及使用concat()函数实现多表合并。为财务分析和数据统计工作奠定了坚实的数据基础。任务小结

感谢聆听!大数据技术在财务中的应用

文档评论(0)

1亿VIP精品文档

相关文档