【精选】kettle操作步骤.pdfVIP

  • 44
  • 0
  • 约1.47千字
  • 约 11页
  • 2017-12-04 发布于贵州
  • 举报
【精选】kettle操作步骤

目录 一、Kettle 简介1 二、Kettle 的使用1 2.1 启动kettle1 2.2 创建转换(transformation )2 2.3 表输入详解:6 2.4 插入/更新详解:10 三、创建作业(job )11 一、Kettle 简介 Kettle 是一款开源纯java 编写的数据抽取工具,高效稳定、绿色无需安装,可以在 Window 、Linux、Unix 上运行。 二、Kettle 的使用 2.1 启动kettle 无需安装,直接双击pdi_kettle 中的“Kettle.exe”即可;如果提示输入用户名密码, 可以直接点击“没有资源库”按钮,等稍后再建立资源库;如下次打开不希望启动此欢迎 页面可将“启动时显示这个对话框”前的勾选去掉 2.2 创建转换(transformation ) 1、如下图,先创建一个转换,名称默认为“转换1”,可以在保存时选择保存路径并修 改其名称 2、选择输入,最常用的输入 “表输入” 、“文本文件输入”和“Excel 输入” ;直接将需要 的输入拖拽到右侧的转换中 3、选择输出,常用的输出有“插入/更新” 、“文本文件输出” 、“表输出”和“Excel Output”,同样是以拖拽的方式将选择的输出放到右侧合适的位置 4 、建立节点连接(hops)可以同时按着shift 和鼠标左键在图形界面上拖拉,也可以 同时选中需要建立连接的两个步骤右键新建连接、确定即可 5、异常处理,有时候在执行某些步骤如插入、删除操作时会出错,这时候需要异常处 理;一般会选择调用存储过程来记录异常 定义过“错误处理”后可以进行“调用DB 存储过程”所需要连的数据库、调用的存储过 程、参数以及返回值的设置 注意:参数的顺序必须与调用的存储过程或函数的顺序一致 2.3 表输入详解: 至此一个简单的转换已经搭起来了,其中表输入是用来从数据库中抽取数据的,里面 主要是查询数据的SQL,尽量给每个字段取别名,别名与将要插入的表中的字段名对应。 由于要读取数据库所以首先要与资源库建立连接 1、如下图所示,创建资源库连接:在主对象树中双击DB 连接,根据具体情况选择合 适的数据库和连接方式并填写连接名、IP、端口、用户名、密码等信息 2、表输入,注意事项如下图所示 3、给表输入的SQL 传参,可用输入中的“文本文件输入”或“生成记录”进行传参 “文本文件输入”需要将参数和值写入文本文档中,然后通过浏览找到该文档并增加到 选中的文件中; 文本文件输入一定不要忘了获取字段 另外有时候还要对内容进行设置,比如是否包含头部等 下面是包含头部时文本的写法 “生成记录”可直接将需要的参数作为字段填入其中,注意” 限制”可理解为”字段” 的重复 使用次数(待确认) 2.4 插入/更新详解: 插入/更新,顾名思义,就是用来执行插入或更新操作的,我们可以通过设置来只执行 插入或执行插入和更新,由于只更新有单独的一个控件可以完成,故这个控件无此功能。 三、创建作业(job ) 一个job 就是一个完整的流程,它可以包含多个转换并控制其执行时间和次数等,只 需要找个转换文件位置,和设置下执行计划

文档评论(0)

1亿VIP精品文档

相关文档