数据集成_kettle_基础.ppt

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据集成_kettle_基础

《数据库原理与应用》 数据集成-软件基础 数据集成软件基础 1.软件运行 2.转换模型 1 软件运行-配置 安装JRE7.0以上 配置JAVA_HOME 1 软件运行-主界面 1 软件运行-菜单 1 软件运行-转换界面 数据实时捕获 1 软件的运行-转换界面 数据实时捕获 数据集成软件基础 1.软件的启动与界面 2.转换模型 2 转换模型-步骤与连接 转换(Transformation)是由多个步骤(step)组成的网络,转换本质上是数据流。 转换的两个相关的主要组成部分是步骤(step)和节点连接(hops)。 转换文件的扩展名是.ktr。 2 转换模型-步骤与连接 3 转换模型-步骤与连接 步骤(Steps)是转换的建筑模块,比如一个文本文件输入或者一个表输出就是一个步骤。 每个步骤用于完成某种特定的功能,通过配置一系列的步骤就可以完成你所需要完成的任务。 3 转换模型-步骤的类型 3 转换模型-连接 节点连接(Hops)是数据的通道,用于连接两个步骤,使得元数据从一个步骤传递到另一个步骤。 节点连接决定了贯穿在步骤之间的数据流,步骤之间的顺序不是转换执行的顺序。当执行一个转换时,每个步骤都以自己的线程启动,并不断的接受和推送数据。 案例2 执行转换 执行转换启动界面 转换执行结果 转换执行结果 * 1 1 转换 步骤 数据输入 Input 数据输出 Output 数据转换 Transfer 流程控制 Flow 查询 Lookup 脚本 Scripting 连接 Join 统计 Statistics 转换模型总体为关系型模型,均会分解成行和列进行处理 3 转换模型-1)流程设置 3 转换模型-2)元数据设置 表输入节点 读取数据 2、元数据设置 3 转换模型-2)元数据设置 Src 数据连接 3 转换模型-2)元数据设置 计算节点 增加字段 3 转换模型-2)元数据设置 插入/更新节点 写数据 3 转换模型-2)元数据设置 Src 数据连接 每个步骤都是一个单独的线程 以线程运行 Rowset Rowset 以同步队列为通信 每次以行为单位进行处理 3 转换模型-线程模型和通信模型 右键单击步骤,可以查看该步骤的输入和输出字段 3 转换模型-步骤的输入输出字段

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档