- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Kettle用户操作手册1
Kettle用户操作手册kettle介绍1.1 什么是kettleKettle是“Kettle E.T.T.L. Envirnonment”只取首字母的缩写,这意味着它被设计用来帮助你实现你的ETTL 需要:抽取、转换、装入和加载数据;它的名字起源正如该项目的主程序员MATT所说:希望把各种数据放到一个壶里然后以一种指定的格式流出。Spoon是一个图形用户界面,它允许你运行转换或者任务。1.2 Kettle 的安装要运行此工具你必须安装 Sun 公司的JAVA 运行环境1.4 或者更高版本,相关资源你可以到网络上搜索JDK 进行下载,Kettle 的下载可以到/取得最新版本。1.3运行SPOON下面是在不同的平台上运行Spoon 所支持的脚本:Spoon.bat: 在windows 平台运行Spoon。Spoon.sh: 在Linux、Apple OSX、Solaris 平台运行Spoon。1.4 资源库 一个Kettle资源库可以包含那些转换信息,这意味着为了从数据库资源中加载一个转换就必须连接相应的资源库。在启动SPOON的时候,可以在资源库中定义一个数据库连接,利用启动spoon时弹出的资源库对话框来定义,如图所示:单击加号便可新增;关于资源库的信息存储在文件“reposityries.xml”中,它位于你的缺省home 目录的隐藏目录“.kettle”中。如果是windows 系统,这个路径就是c:\Documents andSettings\username\.kettle。如果你不想每次在Spoon 启动的时候都显示这个对话框,你可以在“编辑/选项”菜单下面禁用它。admin 用户的缺省密码也是admin。如果你创建了资源库,你可以在“资源库/编辑用户”菜单下面修改缺省密码。1.5 定义1.5.1 转换主要用来完成数据的转换处理。转换步骤,可以理解为将一个或者多个不同的数据源组装成一条数据流水线。然后最终输出到某一个地方,文件或者数据库等。Step:转换步骤,数据流中的处理步骤,对数据进行处理Hop:节点连接,一个Hop 代表两个步骤之间的一个或者多个数据流。一个Hop 总是代表着一个步骤的输出流和一个步骤的输入流。1.5.2 作业完成整个工作流的控制,执行数据处理任务,由一个或多个任务条目(Job Entries)组成,一个任务条目也可以引用一个转换,也可以执行一些文件处理(比较,删除等),还可以ftp上传,下载文件,发送邮件,执行shell命令等。1.5.3 变量(Variables)试用变量的方法可以如下制定:${ Variable}(unix)%%Variable%% (windows)1.6 基本操作1.6.1 拖拽对象按住左键“拖拽”对象到工作区,如下图将表输入拖拽到右侧工作区。1.6.2 右键编辑功能如图点击“表输入”右键,选择“编辑步骤”编辑表输入属性设置(或双击)。如果语句中有变量,就要在上图中“替换SQL语句里的变量”打勾;变量在Parameters中设置如下图所示:点击工作区空白处,编辑“转换”的属性设置,如下图:1.6.3 连接线1)按住shift功能键后左键按住要连接的起始对象指向终止对象。2)在连接线上右键可以删除节点连接。如下图,按住shift功能键后左键按住“表输入”后指向“表输出”:1.6.4 执行、调试、停止如图所示:转换实例(Transformation)2.1数据转移(库—库)a.文件—新建—转换b.从左侧的核心对象中拖动你想要的步骤至右侧的空白区(此例中只需拖入表输入与表输出即可),并用节点连接。 ** 在左侧的核心对象常用的步骤有:输入、输出、转换、连接、查询和脚本。c.双击表输入--数据库连接—新建—填写你要连接的数据库信息—Test—okd.根据需要编写你的sql语句确定rownum表示输出的语句的条数,设置如下:在空白处点击右键e.表输出设置数据库连接:同表输入,根据需要将生成的表导入到相同或不同的数据库;目标表:即生成的表的名字Sepecify database files 要打勾,当要在 Database files里要获得字段就可以点击Get files就可以获得字段,可以根据自己的需要是否删掉不想要的字段。Enter field mapping是设置流里与生成表里的字段的映射关系;如下图所示:@Sream field 是表的输入流,也就是输入表的字段,Table field是输出表的字段,可以根据自己的需要,起字段名称。@当字段添加完成后,要执行Sql,在数据库空中就创建了表及表的结构。@最后,我们就可以点击运行按钮了如果执行成功,就可以到数据库查看你所生成的表了。2.2 值映射 a.界面设计b.值映射如图所示:值映射即把某一字段的源值改变成目标值或者
您可能关注的文档
最近下载
- 2025年秋人教版英语八年级上册Unit 1 Happy Holiday 教案教学设计.docx VIP
- 消除“艾梅乙”医疗歧视-从我做起!.pptx VIP
- 《饮用水源保护区》课件.ppt VIP
- 2025医疗器械偏差管理规程.docx VIP
- 三、功(教学课件)物理苏科版2024九年级上册.pptx VIP
- 2025年巩固拓展脱贫攻坚成果同乡村振兴有效衔接总结15篇 .pdf VIP
- 糖尿病合并高血压患者管理指南2025解读.pptx
- 石家庄空港工业园规划.pptx VIP
- 以中国式现代化全面推进中华民族伟大复兴PPT新时代坚持和发展中国特色社会主义的目标任务PPT课件(带内容).pptx VIP
- 大数据分析师(高级)试题(含答案).pdf VIP
文档评论(0)