- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
DataStage与Informatic对比31
一 关于DataStage与Informatica PowerCenter;可以使用DataStage进行:;DataStage的构成:;DataStage的特点:;多国语言支持(NLS):??? DataStage能够支持几乎所有编码,以及多种扩展编码,可以添加编码的支持,DataStage内部为UTF8编码 。;并行运行能力: ETL Job的控件大多数都支持并行运行,此外DataStage企业版还可以在多台装有DataStage Server的机器上并行执行,这也是传统的手工编码方式难以做到的。这样,DataStage就可以充分利用硬件资源。而且,当你的硬件资源升级的时候也不用修改已经开发好的ETL Job,只需要修改一个描述硬件资源的文件即可。并行执行能力是DataStage所能处理数据的速度可以得到趋近于线性的扩展,轻松处理大量数据。 ;运行环境:
DataStage Client 只能安装在 Windows 平台上面。而 DataStage Server 则支持多种平台,比如 Windows、Solaris、Redhat Linux、AIX、HP-UNIX。;使用:
虽然是图形界面,可使用起来一点也不容易,在数据库的配置上很容易出错。并且,没有批量修改Job的功能,当批量修改Job的时候很麻烦。
另外,DataStage是使用ODBC来连接的。;DataStage中的关键概念:;2.Informatica PowerCenter 概述:
Informatica PowerCenter 是一个可以使大的企业或组织能够按其复杂的业务信息需求,读取、转换和集成遗留系统、关系型ERP,CRM,消息信息和电子商务数据的数据集成平台。
;Informatica PowerCenter的构成:;Repository Server Administration Console
主要进行Reposity的管理,包括Reposity Server的start,shutdown操作。进行Reposity 库的backup、restore等操作,进行Reposity库级别的管理,级别较高。
Workflow Monitor
主要进行流程运行、及任务运行时的流程运行情况跟踪。可以跟踪日志。包括Session日志和Workflow日志,可以设置生成日志的循环个数。分析session运行是对源数据库的数据抽出信息和对目标数据库的更新信息。
;Workflow Manager
主要用于流程任务(workflow Task)的设计。进行任务流程的设计、每一个Tast针对一个Session,一个session针对一个mapping,其中workflow中的Folder和Designer中的folder相对应的关系。一版来说,用户都是建立自己的Folder。
;Informatica PowerCenter的特点:;2) 积极、开放的元数据,跟标准兼容(CWM/XMI)。
3) 对广泛数据源的支持和通用的数据连通性。PowerCenter显著的连通性提供统一的入口,访问一组系统,当简化集成管理和维护时,能使企业非常容易地应对经常变换的基础架构的集成挑战
4) 对实时数据源的支持。
5) 先进的会话管理、工作流机制。支持Workflow机制,通过多种工作流调度方法,可以将ETL Session、外部命令、Email,以及数据库脚本等任务有机地结合在一起,从而定制复杂的工作流。;6) 高性能和负载均衡(多服务器、并发、分区、Server Grid等)。支持并行处理充分利用多处理器;支持多线程的流式处理,可以分区(多线程)处理读取/传递/写入进程,从而实现对数据的高效抽取、传输和分发。
7) 可扩展及分布式的体系结构。 ;8) 国际化支持,可处理任何字符集。
9) 对数据质量和数据清洗的支持。
10) 支持各种平台。
11) 开放性,提供APIs和SDK。 ;Informatica PowerCenter中的关键概念:;二 关于ETL;ETL分别在DataStage和PowerCenter中的简单实现;5)保存,编译,运行。
6)用Director来监控运行过程。
7)结束。;2.在Informatica PowerCenter中:
1)在ODBC中配置一个数据库,用于给PowerCenter存储源码。
2)使用Repository server Administration Console工具创建知识库。(依赖于一个数据库)
3)使用Designer设计Mapping并保存。
;4)将
文档评论(0)