- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向服务的数据集成方法
1 1 1
胡超 周晓峰 李超
1河海大学计算机及信息工程学院 南京(210098 )
Email:honghuhuchao@163.com
摘 要:围绕异构环境中数据集成及主动服务方面的需求,在 Web Services 的基本框架下,
采用 WSDL、UDDI、SOAP、XML 等技术,设计基于主动服务的数据集成平台。通过构建全局本
体库解决语义异构问题,利用 WSDL 描述用户提供的服务,主动推送用户所需数据,为实现
基于主动服务的分布式异构数据集成提供了一套有效的解决方案。
关键词:数据集成、本体、Web Service、WSDL、主动服务
中图分类号:TP302.1
1 引言
如何获取网络上自治、异构、分布的数据并加以综合利用,即数据集成,成为一个引起
广泛关注的研究领域。数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有
机地集成,实现分布的、异构的、自治的数据共享的主要技术,数据集成一般还应满足用户
数据访问的实时性和安全性等方面的要求。目前,数据集成[1]主要通过多数据库集成技术、
Mediated系统、数据仓库技术、移动Agents技术和基于Web Services的信息集成技术实现。
2 传统的数据集成方法
早在20世纪70年代中期就提出了多数据库的集成问题。多数据库集成系统支持用户使用
单一数据定义和操作语言,同时访问多个独立的数据源。代表性的多数据库系统有
Garlic,Tsmmis,IRO-DB、Yat和HP公司开发的Pesasus[2]。国内有东北大学数据库研究室开发
的PolyBase和SCOPE系统以及北京理工大学的UNHDB系统等。多数据库集成系统开始采用全局
模式的集成方法,后来Mcleod等人提出了联邦数据库系统的概念。联邦数据库系统是由参与
联邦的半自治的数据库系统组成,目的是实现数据库系统间部分数据的共享[3]。由于缺乏必
要的标准,联邦数据库系统只能在一定的限制条件下实现,难以实现各种数据源的灵活数据
集成。多数据库集成系统难以实现非数据库系统中的数据,可扩展性不强。对于网络上越来
越丰富的数据源,多数据库集成系统不是一个很好的解决方案。
Mediated系统通过提供所有异构数据源的虚拟视图来实现集成,数据源可以是数据库、
遗产系统、Web数据源等。用户针对mediated模式提交查询。Mediated系统中的数据源是自
治的,所以对数据源的访问通常是只读的,而联邦数据库系统支持读写访问[4]。Mediated系
统主要由中介器 (Mediator)和针对每个数据源的包装器 (Wrapper)组成[5][6]。随着中间件
技术的发展,Mediated系统基于中间件实现,这就是基于中间件的分布式集成系统[7]。基于
- 1 -
中间件的分布式集成系统用分布式的对象模型,诸如,微软的分布式组件对象模型
(DCOM)[8][9]、CORBA[10]或Sun的RMI[11]来构建信息集成系统[12]。这种方法有效的避免
了联邦数据库系统带来的开发代价大,代码难以重用的问题,利用网络计算环境可以有效的
实现复杂的大规模的信息集成。但是,DCOM,CORBA或RMI要求服务客户端与系统提供的服务
本身之间必须进行紧密耦合,即要求一个同类基本结构。
数据仓库技术需要建立一个存储数据的仓库,由ETL工具定期从数据源过滤数据,然后
装载到数据仓库,供用户查询[13]。数据仓库系统由ETL工具、集成器和数据仓库构成[14]。数
据仓库中主要存储历史数据和汇总数据,用于决策支持,通常不允许用户对数据仓库进行更
新。数据仓库技术查询处理性能高,但是数据可能不是最新的,实时性不好。
20 世纪 90 年代初,General Magic公司第一次提出了移动Agent的概念,即一个能在异构
环境中自主地从一台主机迁移到另一台
文档评论(0)