- 0
- 0
- 约4.22千字
- 约 8页
- 2026-02-09 发布于北京
- 举报
Kettle之output中文文档
说明:使用kettle3.0.0版本。
Cube输出:
说明:输出串行化数据,将数据于二进制数据形式,当向后分析文本内容,
它将比平面文件更有优势。
个人认为:kettle开始支持文本搜索,尤其是对文本文件的搜索,这是对文本搜索的基础支
持。但是还是的功能比较简单,目前的功能只是串行化的文本。
文本文件输出:将抽取到的数据输出到平面文件。以下是文本文件输出的设定界面,大部分
选项相信大家都应用过了,我所说明的就是“文件名中包含日期/时间”选项,可以区分不
同时间抽取的数据,以便以后区分存档。“封闭符”是将数据字指定的字符封闭起来,
XML输出:将数据输出到XML文件中。
参数设定:
⚫“文件”选项卡:“文件名称”指定文件路径和名称,“扩展”指定为XML,“在文件名
中包含步骤号码?”是否当前步骤号;
⚫“内容”选项卡:确定XML文件的格式和编码形式,“已压缩”确定当前输出文件是
否生成压缩包。“正在编码”选择编码格式,一般选择UTF-8格式,“父XML元素”指
定XML根tag,“记录XML元素”指定行记录的tag,“分割各一个…记录”将抽取的
数据分割到不同且连续编号的文件中,目的是使得文件大小合适,在文件时占
去空间较小。
⚫“字段”选项卡:点取“获取字段”将上一个步骤输出的字段元数据获得。
更新:根据关键字段将数据更新到目标表,选择数据库连接和选择表及CommitSize等的操
作不必多讲,“用来查询值的关键字”列表就是将上一个步骤流入的数据和目标表中的字段
比较,我们可以选择比较的字段和比较的条件,以达到比较增量更新的目的,其实就是实现
了一个程序级的lookup的功能。
个人观点:本功能和/更新有相仿的地方,只是/更新的部分功能,不执行操作,
所以/更新就不介绍了。
删除:将上一步骤的抽取的数据与目标表的数据进行比较,将目标表的数据与上一步骤抽取
的数据相同的数据删除。
未完待续。。。。欢迎大家修改
Kettle之output
Documentation
Note:Usingkettleversion3.0.0.
CubeOutput:
Note:Outputsserializeddata,storingthedatainbinaryformat.Whenanalyzing
textcontentlater,thi
原创力文档

文档评论(0)