ETL利器Kettle实战应用解析系列二【应用场景和实战DEMO】.doc

ETL利器Kettle实战应用解析系列二【应用场景和实战DEMO】.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ETL利器Kettle实战应用解析系列二【应用场景和实战DEMO】

1、应用场景 这里简单概括一下几种具体的应用场景,按网络环境划分主要包括: 表视图模式:这种情况我们经常遇到,就是在同一网络环境下,我们对各种数据源的表数据进行抽取、过滤、清洗等,例如历史数据同步、异构系统数据交互、数据对称发布或备份等都归属于这个模式;传统的实现方式一般都要进行研发(一小部分例如两个相同表结构的表之间的数据同步,如果sqlserver数据库可以通过发布/订阅实现),涉及到一些复杂的一些业务逻辑如果我们研发出来还容易出各种bug; 前置机模式:这是一种典型的数据交换应用场景,数据交换的双方A和B网络不通,但是A和B都可以和前置机C连接,一般的情况是双方约定好前置机的数据结构,这个结构跟A和B的数据结构基本上是不一致的,这样我们就需要把应用上的数据按照数据标准推送到前置机上,这个研发工作量还是比较大的; 文件模式: 数据交互的双方A和B是完全的物理隔离,这样就只能通过以文件的方式来进行数据交互了,例如XML格式,在应用A中我们开发一个接口用来生成标准格式的XML,然后用优盘或者别的介质在某一时间把XML数据拷贝之后,然后接入到应用B上,应用B上在按照标准接口解析相应的文件把数据接收过来; 综上3种模式如果我们都用传统的模式无疑工作量是巨大的,那么怎么做才能更高效更节省时间又不容易出错呢?答案是我们可以用一下Kettle-_-! 2、DEMO实战 2、1 实例1:数据库TestA中的UserA表到数据库TestB的UserB表 1)为方便演示,我这边把Sql脚本贴出来,大家直接复制在sqlserver中运行即可,sql脚本如下: 简单表之间交换 use master IF EXISTS(SELECT 1 FROM sysdatabases WHERE NAME=NTestA) BEGIN DROP DATABASE TestA --如果数据库存在先删掉数据库 END GO CREATE DATABASE TestA ON PRIMARY --创建主数据库文件 ( NAME=TestA, FILENAME=E:\ETL\DB\TestA.dbf, SIZE=5MB, MaxSize=20MB, FileGrowth=1MB ) go use TestA -- 建立一个测试的用户表 create table usersA ( id int not null, userid varchar(50) not null, username varchar(200) null ) go -- 插入3条记录 insert into usersA values(1,lisi,李四); insert into usersA values(2,zhangsan,张三); insert into usersA values(3,lisi,李四); go use master IF EXISTS(SELECT 1 FROM sysdatabases WHERE NAME=NTestA) BEGIN DROP DATABASE TestA --如果数据库存在先删掉数据库 END GO CREATE DATABASE TestB ON PRIMARY --创建主数据库文件 ( NAME=TestB, FILENAME=E:\ETL\DB\TestB.dbf, SIZE=5MB, MaxSize=20MB, FileGrowth=1MB ) go use TestB -- 建立一个测试的用户表 create table usersB ( id int not null, userid varchar(50) not null, username varchar(200) null ) go 2)Kettle实现方式 功能简述:数据库TestA中的UserA表到数据库TestB的UserB表; 实现流程:建立一个转换和一个作业Job; A:建立一个转换:打开Kettle.exe,选择没有资源库,进入主界面,新建一个转换,转换的后缀名为ktr,转换建立的步骤如下: 步骤1:创建DB连接,选择新建DB连接,如下图,我们输入相应的Sqlserver配置信息之后点击Test按钮测试是否配置正确! 我们需要建立两个DB连接,分别为TestA和TestB; 步骤2:建立步骤和步骤关系,点击核心对象,我们从步骤树中选择【表输入】,如下图,这样拖拽一个表输入之后,我们双击表输入之后,我们自己可以随意写一个sql语句,这个语句表示可以在这个库中随意组合,只要sql语句没有错误即可,我这里只是最简单的

文档评论(0)

2017ll + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档