Kettle开发使用手册 - 开发文档.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

划安排工作。新建ktr脚本可以点击左上角的文件--

划安排工作。新建ktr脚本可以点击左上角的文件--新建--转换,新建kjb脚本就文件--新建-

,那么将源表的此条数据插入到目标表。图2.14这四个步骤编辑完成后最后就是执行这四个步骤了,点击左上

,因为服务器上交换平台传进来的starttimestamp和endtimestamp参数也是stri

,如图2.4所示,跟着我们按照主界面的提示拖动主键来操作。拖动组件在核心对象的组件库里。图2.4跟着

Kettle开发使用手册

2017年4月

0)notnull,VARCHAR2(18)notnull,NUMBER(10)notnull,CH,因为服务器上交换平台传进来的starttimestamp和

0)notnull,VARCHAR2(18)notnull,NUMBER(10)notnull,CH

,因为服务器上交换平台传进来的starttimestamp和endtimestamp参数也是stri

=javax.sql.DataSourcegppublic/driver=org.postgresq

-作业。我们这里传输数据只要用到kjb脚本,一张表的数据传输要有1个脚本。首先先新建一个ktr文件

版本历史说明

版本

版本

1.0

作者

彭伟峰

日期备注

2017.04.11

2(11)notnull,SBDJZTCHAR(2)notnull,DJSLRYDMVARCHAR2件,这里名称跟入参一样,kettle变量名的写法是${Variables},类型我们选择string调用一个或多个ktr

2(11)notnull,SBDJZTCHAR(2)notnull,DJSLRYDMVARCHAR2

件,这里名称跟入参一样,kettle变量名的写法是${Variables},类型我们选择string

调用一个或多个ktr。Ktr和kjb的关系类似于像员工和领导之间,员工负责具体的事务操作,领导负责计

epository文件夹,再选择这个文件夹作为根目录,名称和描述可以任意写,如图2.2所示:图2.2

1.1.什么是Kettle

Kettle是纯Java编写的、免费开源的ETL工具,主要用于抽取(Extraction)、转换(Transformation)、和装载(Loading)数据。Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出。在这种思想的设计下,Kettle广泛用于不同数据库之间的数据抽取,例如Mysql数据库的数据传到Oracle,Oracle数据库的数据传到Greenplum数据库。

1.2.Kettle的安装

Kettle工具是不需要安装的,直接网上下载解压就可以运行了。不过它依赖于Java,需要本地有JDK环境,如果是安装4.2或5.4版本,JDK需要1.5以上的版本,推荐1.6或1.7的JDK。

运行Kettle直接双击里面的批处理文件spoon.bat就行了,如图1.1所示:

图1.1

,像下面的oracle和gp数据库的driver和url地址写法就不一样。

,像下面的oracle和gp数据库的driver和url地址写法就不一样。oracledbmhpt/

r,因此,varchar2(n)要改成varchar(n),number(n)要改成integer(

示数据开始时间跟数据结束时间。这里填上了默认值方便测试。图2.7图2.8设置入参后再编辑获取变量的组

调用一个或多个ktr。Ktr和kjb的关系类似于像员工和领导之间,员工负责具体的事务操作,领导负责计

2.1.建立资源库(repository仓库)

Repository仓库是用来存储所有kettle文件的文件系统,由于数据交换平

台服务器管理kettle文件也是用Repository仓库,因此我们这边本地的kettle开发环境也是要用到该资源库。建立资源库的方式是工具--资源库--连接资源库,这时候弹出一个窗口,我们点击右上角的“+”号,跟着点击下面的kettle选项,按确定,如图2.1所示:

图2.1

跟着在右上角选择一个目录,建议在kettle路径下新建repository文件夹,再选择这个文件夹作为根目录,名称和描述可以任意写,如图2.2所示:

图2.2

建完后会kettle工具会自动连接到repository资源库,每次打开kettle也会弹出一个窗口让你先连接到资源库。在连接到资源库的情况下打开文件就是资源库所在目录了

文档评论(0)

蒋老师学习资料 + 关注
实名认证
文档贡献者

各种资料欢迎欢迎下载

1亿VIP精品文档

相关文档