大数据采集技术与应用课件:大数据清洗技术Kettle.pptx

大数据采集技术与应用课件:大数据清洗技术Kettle.pptx

;;任务引入;;教学内容;Kettle基本概念;ETL:是抽取(Extract)、转换(Transformation)和加载(Load),对于企业或行业来说,在进行数据分析之前需要对多源数据进行选择、转换、迁移,消除重复、错误的数据,处理缺失的数据,这些工作需要相应的工具来完成,这个工具就是ETL。;Kettle是ETL工具集,它允许用户管理来自不同数据库的数据,Kettle提供一个图形化的用户环境来描述用户想做什么,而不需要描述怎么做。因此,使用Kettle可以方便用户进行数据的清洗工作。;Kettle主要由四个部分构成:Spoon、EEdataIntegrationServer、Br

文档评论(0)

1亿VIP精品文档

相关文档