- 1、本文档共84页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Informatica PowerCenter培训 曹顺波 日程 Informatica PowerCenter介绍 Informatica PowerCenter开发设计 Informatica PowerCenter增量更新 Informatica PowerCenter管理维护 Informatica PowerCenter故障处理 什么是ETL 分析数据来源于业务处理系统,但是它并不是对源系统数据的简单叠加,它需要按照分析的逻辑模型和物理模型,在源系统数据分析的基础上,按照源系统数据和目标数据之间的映射关系,经过数据的抽取(Extraction)、转换 (Transformation)和加载(Loading)等环节方可进入目标库,这个过程简称为ETL处理。 ETL过程 数据质量很重要 PowerCenter ---- 高效的数据集成平台 数据集成平台 – PowerCenter Informatica PowerCenter 是Informatica公司开发的世界级的企业数据集成平台,也是业界领先的ETL工具。Informatica PowerCenter使用户能够方便地从异构的已有系统和数据源中抽取数据,用来建立、部署、管理企业的分析数据,从而帮助企业做出快速、正确的决策。此产品为满足企业级要求而设计,可以提供企业部门的数据和电子商务数据源之间的集成,如XML,网站日志,关系型数据,主机和遗留系统等数据源。此平台性能可以满足企业分析最严格的要求。 广泛的数据支持 支持各类型数据源 主机系统 ERP 消息中间件 结构化 非结构化 平面文件 。。。 丰富的ETL功能 PowerCenter 图形化界面 完善的数据采集和分发手段 数据采集和分发 批处理 增量 实时 断点续传 RSA 加密和压缩 调度和监控 任务串行、并行控制 多Server协同工作 基于时间、事件、操作系统外部命令等触发方式 Email提醒异常情况 。。。 Informatica特点 E 最全面的数据支持,数据库、应用系统、文本、主机系统、消息中间件等等。 最全面的采集手段,批处理、实时、增量CDC(读日志的方式实现增量捕捉)等等。 T 以元数据为核心团队的协作开发,图形化、流程化管理, “一次设计,随处运行”。 丰富处理组件和数据处理函数,支持JAVA、C等自定义开发。 L 基于时间、事件、操作系统外部命令等多种触发方式,支持断点续传、 RSA 加密和压缩。 多服务器协同工作,串行、并行处理数据,Email提醒异常情况。 企业级 统一产品平台管理,各Options无缝集成,提供SOA服务。 提供故障切换、无缝回复、网格计算、动态分区等企业级高可用性要求。 Informatica PowerCenter开发设计 PowerCenter客户端简介 PowerCenter客户端简介 PowerCenter Designer:设计开发环境,定义源及目标数据结构;设计转换规则,生成ETL映射 Workflow Manager:合理的实现复杂的ETL工作流,基于时间,事件的作业调度 Workflow Monitor:监控Workflow和Session运行情况,生成日志和报告 Repository Manager:资料库管理,包括安全性管理等 Informatica PowerCenter Administration Console :资料库的建立与维护 什么是Mapping? 逻辑上定义ETL处理过程,包括 从数据源读取数据 定义数据清洗转换规则 将数据装载到目标 什么是Workflow? ETL工作流,使数据抽取可以基于时间、事件 PowerCenter工作流程 整体流程:创建Mapping 创建Workflow 运行 具体流程 创建数据源 创建数据目标 创建Mapping 创建Session 创建Workflow 运行Workflow PowerCenter使用具体步骤 1、创建连接源和目标的数据库驱动 2、创建数据源 3、创建数据目标 4、创建Mapping 5、创建workflow所需的数据库驱动 6、创建workflow 7、运行workflow 练习1 场景描述: 将纳税人登记信息表DJ_NSRXX导入表纳税人信息DM_NSRXX中。 PowerCenter功能介绍 Source Qualifier Expression Filter file list Joiner Sequence generator Sorter aggregator Router update strategy Transformation介绍- Source Qualifier 从文本文件或
您可能关注的文档
- A-立体植物工厂-种苗生产.ppt
- BBB大学网络整体设计方案201005.doc
- BEA Weblogic Integration国内外用户及典型应用.doc
- BSI更换步骤.ppt
- ccnp详细笔记-switch 总结.doc
- Chapter 6 配置WINS服务器.ppt
- cnki个性化增值服务模式与应用.ppt
- Coreldraw_12第一课.ppt
- CorelDRAW_X3_第9章.ppt
- coreldraw实习课题计划(1).doc
- 数据仓库:Redshift:Redshift与BI工具集成.docx
- 数据仓库:Redshift:数据仓库原理与设计.docx
- 数据仓库:Snowflake:数据仓库成本控制与Snowflake定价策略.docx
- 大数据基础:大数据概述:大数据处理框架MapReduce.docx
- 实时计算:GoogleDataflow服务架构解析.docx
- 分布式存储系统:HDFS与MapReduce集成教程.docx
- 实时计算:Azure Stream Analytics:数据流窗口与聚合操作.docx
- 实时计算:Kafka Streams:Kafka Streams架构与原理.docx
- 实时计算:Kafka Streams:Kafka Streams连接器开发与使用.docx
- 数据仓库:BigQuery:BigQuery数据分区与索引优化.docx
文档评论(0)