DataStage培训经典.ppt

DataStage培训经典创新

DATASTAGE 培训 内容提要: 一、datastage 介绍 二、如何安装datastage 三、配置datastage 工程 四、设计并运行datastage的job 五、操作元数据 六、操作关联数据 七、操作约束条件及数据来源 八、定义查找使用的哈希文件 九、聚合数据 十、job的运行及调试 十一、创建Basic表达式 一,datastage的介绍 本章主要讲解ETL的概念,datastage的介绍、组成及主要功能。 ETL概要 ETL包括数据抽取(Extract)、数据转换(Transform)以及数据加载(Load)3个阶段。 一般而言,这三个过程中有二次落地(生成中间文件)。 Ascential DataStage 是一套专门对多种操作数据源的数据抽取、转换和维护过程进行简化和自动化,并将其输入数据集市或数据仓库目标数据库的集成工具。 DataStage 能够处理多种数据源的数据,包括主机系统的大型数据库、开放系统上的关系数据库和普通的文件系统 。包括Oracle,Sybase,DB2,SQL Server,Teradata, FTP文件系统,文本文件等等。 数据清洗、转换、加载都可以在图形化工具里完成,同样可以灵活的被外部系统调度,提供专门的设计工具来设计转换规则和清洗规则等,实现了增量抽取、任务调度等多种复杂而实用的功能 。

文档评论(0)

1亿VIP精品文档

相关文档