ETL工具kettle学习总结.docxVIP

  • 108
  • 0
  • 约1.52万字
  • 约 31页
  • 2020-11-22 发布于广东
  • 举报
概览 Kettle也叫PDI(全称是Pentaho Data Integeration),是一款开源的ETL工具,项目开始于2003年,2006年加入了开源的 BI 组织 Pentaho, 正式命名为PDI。官方网站: / 术语 Transformation 转换步骤,可以理解为将一个或者多个不同的数据源组装成一条数据流水线。然后最终输出到某一个地方,文件或者数据库等。 Job 作业,可以调度设计好的转换,也可以执行一些文件处理(比较,删除等),还可以ftp上传,下载文件,发送邮件,执行shell命令等, Hop 连接转换步骤或者连接Job(实际上就是执行顺序)的连线 Transformation hop:主要表示数据的流向。从输入,过滤等转换操作,到输出。 Job hop:可设置执行条件: 无条件执行 当上一个Job执行结果为true时执行 当上一个Job执行结果为false时执行 Kettle,etl设计及运行 Kettle整体结构图 Kettle整体结构图 转换设计样例图 绿色线条为hop,流水线 转换设计样例 运行方式 使用 java web start 方式运行的配置方法 命令行方式 Windows下执行kitchen.bat,多个参数之间

文档评论(0)

1亿VIP精品文档

相关文档