数据集成项目解决方案探讨.pptVIP

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2010-09-04 目录 一、数据集成的必要性 二、数据集成主要的三种架构 三、数据集成相关技术 四、港口数据集成解决方案 一、数据集成的必要性 1、使企业数据资源形成互通互联的整体 在企业发展的过程中,相继实施了多个应用系统,每一个应用系统都有自己的运行环境和数据存储方式,从而产生了各种不同的数据源,需要通过数据集成形成互通互联的整体。 2、满足企业决策分析的需要 企业管理层越来越需要通过信息系统来分析企业整体运营情况,这就需要对信息资源进行整合,形成统一的系统访问入口,避免造成新的门户孤岛现象。 3、有助于规范数据和代码统一 通过进行数据集成,有助于将不同系统内的代码进行规范,形成企业统一的代码标准。 二、数据集成主要的三种架构 单个系统的数据集成架构 这是目前主要的数据集成架构,主要是以数据仓库系统为代表,集成企业主要基础信息系统的数据,经过ETL(清洗、转换、装载)后,转换为统一标准,按照星形或雪花型模型存储海量数据,面向企业的人、财、物等主题进行数据分析或挖掘。 特点是多对一架构,转换条件复杂,支持TB级的数据量处理和加载,数据存储结构比较特殊,数据加载层级比较清晰。 缺点是数据实时性不高、程序编程量较大,数据是单向传递的。 企业统一数据集成架构 这种架构适合于像大型银行、税务、电信等业务比较独立、组织结构比较复杂的单位,如银行的总行和分行间的数据交换。 对于企业主要信息系统的数据可直接来自数据中心,摆脱了没有企业数据中心前的一对多交叉的问题,可有效避免业务系统对应多种管理系统时需要数据重复传送,比如某个业务系统新增了一个客户信息,可直接由数据集成平台发送至数据中心,然后由数据中心根据需要将该信息发送至相关业务系统即可。 这种架构的特点是属于多对多、数据交换频繁、数据接口和数据类型比较繁多,可实现数据双向交换。 企业统一数据集成架构 机构之间数据集成架构 这种架构一般应用于跨企业、跨机构的数据集成和交换,通过制定统一的数据标准,从而形成一个多机构间的数据集成平台,比较典型的是银联和各商业银行间的数据集成。 这种架构相对比前两种架构,具有跨多企业、单位之间多对多,网络交换较为复杂,数据安全性和实时性较高。 机构之间数据集成架构 三、数据集成相关技术 1、ETL技术 一是采用手工编程或专项ETL工具,这种方法是目前使用较为广泛的方法,适合满足较为复杂的数据集成需要。具体方式有PB、JAVA、存储过程、C/C++等,优点是比较灵活,但存在多一种系统的数据集成就会多一倍的工作量,可拓展性和实时性较差; 另外也有针对具体某个行业如银行的专项ETL工具,可减少部分工作量,但具有较大的局限性,不能够通用。 手工编程模式 二是采用商品化的数据集成软件,如Informatica PowerCenter、IBM DataStage、Oracle ODI等,这些软件可在较大程度上减少人工编程量,提高效率。 2、数据联邦技术 通过数据联邦技术可使数据逻辑看上去存在一个位置,但实际的物理位置却可能在多个数据源中。数据联邦技术提供了一种为数据提供抽象的数据接口的能力。这些多个数据源组成的虚拟视图可以使用户不需要知道数据的物理位置、数据结构和保存方式。 和传统数据集成方式相比,不需要建立中央数据库,不保存实际数据,可以最大限度的保证数据的实时性,前提是首先要有统一的代码标准,否则数据集成质量较差。 数据联邦技术适合于对集成数据实时性要求比较高,数据经常变换的环境下,不适合于包含过于复杂数据转换,数据集特别巨大,否则会使数据转换的效率降低。 比较典型的有BEA AquaLogic Data Services Platform、IBM — Federation Server等。 3、基于SOA的数据集成 数据联邦技术从本质上讲并非真正意义的数据集成,更接近一种数据库视图的方式,但一定程度上解决了集成实时性的问题,近年来,出现了基于SOA架构的数据集成,一般包括两个过程,一是对数据按照SOA架构的需要进行整合加工形成可用的信息,二是将信息以符合SOA规范的方式发布出去。 3.1 基于ODS(操作性)的数据集成 这是其中的一种实时数据集成模式,是基于数据仓库演化而来。这种方式?将分散在数据层的数据先整合到ODS或者数据仓库中进行整合加工,然后再将加工

文档评论(0)

xiangxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档