- 2
- 0
- 约6.45千字
- 约 54页
- 2018-11-26 发布于安徽
- 举报
WORD完美格式编辑
专业资料整理
ODI工具抽取数据操作手册
一、准备工作(以ORACLE 11G为例)
1、ODI是oracle的数据抽取工具,需要自行安装oralce数据库。
2、请按照ODI安装说明书安装rcu资料库和ODI工具。
ODI11G安装及使用_百度文库:
HYPERLINK /link?url=HSHQvFYg5Vu-Z4aPJ_7Bm2bCRKxnANKLDpCF91yjrD8G0xFmGZ_iu2M0Z8yhLTP_6ULJlUK7GLSsYQNlsuhAXJKY5FAhvV-jIC0hWeSToxe /link?url=HSHQvFYg5Vu-Z4aPJ_7Bm2bCRKxnANKLDpCF91yjrD8G0xFmGZ_iu2M0Z8yhLTP_6ULJlUK7GLSsYQNlsuhAXJKY5FAhvV-jIC0hWeSToxe
3、理解:资料档案库
资料库分两种:
(1)Master Repository(主资料库),保存企业所有IT资源的Topology,保存项目和数据模型的安全信息、版本信息,供ODI图形模块等使用。通常创建一个即可。Master Repository要尽可能独立存储,单独的Instance,或单独的Schema。
(2) Work Repository(工作资料库),保存项目和数据模型,供ODI图形模块等使用。可创建多个。一个Work Repository只能连接一个Master Repository。一个Schema只能存储一个Work Repository,不过Master Repository倒可与其安装在同一Schema。
4、Topology
Topology Manager(拓扑管理器)主要用来管理下面5类任务,并将信息存储在主资料库中,供所有模块共享使用。
(1)物理体系结构,定义各种技术及其数据服务器、物理架构、物理代理。
(2)逻辑体系结构,定义各种技术及其关联的逻辑架构、逻辑代理。
(3)上下文,用来连接物理架构和逻辑架构。
(4)语言,不同技术所能采用的语言特性。
(5)资料库,包含主资料库及其附属的工作资料库。
5、知识模块
Oracle Data Integrator之所以能适应不同的、多种多样的数据源,灵活有效的完成数据抽取/转换/载入的过程,均是基于其知识模型体系。 Knowledge Modules类似于程序中的插件,Oracle Data Integrator将数据整合的任务抽象出六个组成部分:
(1)反向工程RKM,Reverse-engineering knowledge modules,用于从数据源读取表及其他对象。
(2)日记JKN,Journalizing knowledge modules,用于为单一或一组表/视图记录新建的和修改的数据。ODI支持部分数据源的Change Data Capture(CDC)功能,前提为ODI项目中启用该模块。
(3)加载LKM,Loading knowledge modules,用于从数据源抽取数据。
(4)检查CKM,Check knowledge modules,用于检测抽取出的源数据的合法性。
(5)集成IKM,Integration knowledge modules,用于将Staging Area中的数据转换至目标表,基于目标数据库产生对应的转换SQL。
(6)服务SKM,Service knowledge modules,提供将数据以Web Services的方式展现的功能。
6、源系统
需要知道源系统的数据库用户密码与源系统IP地址或主机名、数据库端口、数据库实例。(以223这台机为例)。
数据库链路:jdbc:oracle:thin:@ 23:1521:gbk
数据库用户/密码:rcms/123456
数据:EMP(表)
7、创建目标系统的用户(以 50这台机为例)。
数据库链路:jdbc:oracle:thin:@ 0:1521:orcl
数据库用户/密码:spaq_odi/spaq_odi
并且需要在目标用户上创建源用户的表或视图,表结构需要与源用户的表结构一致。
create user spaq_odi identified by spaq_odi default tablespace users; grant connect,resource to spaq_odi; grant create database li
原创力文档

文档评论(0)