kettle使用手册.docx

Spoon.bat修改在set opt=*最后 -Dfile.encoding=UTF-8,解决乱码问题表输入替换SQL语句中的变量:变量用 ‘?’ 表示从步骤中插入数据:这个组件之前的流程名称 新建/编辑Wizard(向导)填写数据库连接名称(选择数据库连接类型和数据库访问类型)NEXT端口号默认 NEXT点击测试数据库连接获取SQL查询语句选择表或者视图,确定 也可以自定义SQL语句.预览查询查询所需关键字:字段1为流入字段查询返回的值:字段为数据库表字段,可以起个别名,类型不选可能导致跨库乱码获取查询关键字:流入的所有字段获取返回字段:所选数据库表所有字段Switch/CaseSwitch字段:流入的字段Case值数据类型:视情况而定Case值:此处为空时-转到-查询DEPT_CODE默认目标步骤(default):自定义流程,如图字段选择移除:移除流入字段元数据:修改元数据字段选择和修改:如果指定了移除和元数据就不能选择列映射增加常量添加一列到元数据流中设置字段值替换流字段的值表输出主选项默认不是临时表的话,千万不要选中剪裁表,这个用于删除表中的数据勾选’指定数据库字段’后才能操作’数据库字段面板’提交记录数量:每次批处理的数量,一批对应一个事务输入字段映射不要随便点’猜一猜’空操作什么也不做删除查询所需的关键字:删除的条件插入/更新不推荐使用比较流中和数据库表的值,不同则更新编辑映射:同表输出字符串替换过滤两个或以上中文并设置为空串去除重复记录注意:去除的记录要排序,否则只去除连续的值行扁平化详解:/Document/detail/tid/73025Access输入选择mdb格式文件,支持正则过滤Kettle增量更新/s/blog_6d35752501015dtm.html获取系统信息类型预览记录计算器如下是移除元数据流字段,新数据流加负号Kettle变量名称对应参数值:可以写SQL函数,比如sysdate+1,to_date()等相对应的变量名位置对应参数获取系统信息此处添加两个变量作为增量的值设置变量变量活动类型: 2)?通过属性文件(常用)在C:\Users\${userName}\.kettle\perties?中添加变量(key=value)Java?Virtual?Machine:S系统级作用域,凡是在一个java虚拟机下运行的线程都受其影响。parent?job:在当前作业下是生效的。grand-parent?job:在当前作业的父作业下是生效的。the?root?job:R级作用域,凡是在跟作业下运行的都是生效的 变量替换SQL语句勾选“替换SQL语句里的变量“和”执行每一行“?合并记录比较两个数据源数据关键字段:用于定位两个数据源中的同一记录数据字段:比较的字段标志字段:用于保存比较的结果1. “identical” – 旧数据和新数据一样2. “changed” – 数据发生了变化;3. “new” – 新数据中有而旧数据中没有的记录4. “deleted” –旧数据中有而新数据中没有的记录过滤记录过滤后的数据发送到false步骤此处有掌声

文档评论(0)

1亿VIP精品文档

相关文档