- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
跨组织信息集成平台研究与开发-China-VO.ppt
数据集成与网格:关于数据网格的组织结构问题 潘久辉 暨南大学计算机科学系 2006年11月 数据集成与网格 关于数据网格的组织结构问题 一、数据集成与网格 网格与数据网格 一、数据集成与网格 一、数据集成与网格 数据集成 一、数据集成与网格 分布式数据库与异质多数据库 一、数据集成与网格 联邦数据库 一、数据集成与网格 数据中介系统 一、数据集成与网格 数据汇集 异构性问题 一、数据集成与网格 语义冲突 不同数据集藏之间可能在两个层面上发生语义冲突. · 数据层面:相同数据可能具有不同的表示和解释. · 模式层面:同类信息对象的表示可能使用不同逻辑结构 能有效表现概念层次结构和语义模型的本体被广泛运用于解决信息集成中的语义冲突问题. 一、数据集成与网格 跨组织信息集成问题: 一、数据集成与网格 信息源在包装层支持如下两个抽象层面: 一、数据集成与网格 二、关于数据网格的组织结构问题 数据网格系统: 提供一个可跨越组织和地域分布动态地按各种形式实现数据集成的平台,在组织结构上,这样一个平台可以分为两个层面构造. 资源获取与系统互操作性平面:提供网格环境下数据访问与集成的基础设施。 高级集成形式支撑层面:支持数据联邦、数据中介、数据汇集等高级数据集成形式的实现. 二、关于数据网格的组织结构问题 资源获取与系统互操作性平台 提供网格环境下数据访问与集成所需基础设施的大部分功能特性已经由网格中间件OGSA-DAI所提供,其目的包括: 二、关于数据网格的组织结构问题 OGSA-DAI支持的对等初等数据网格 二、关于数据网格的组织结构问题 资源节点提供的服务与接口 二、关于数据网格的组织结构问题 数据传播与汇集服务: 通过视图复制、多源视图维护及多视图一致性维护等技术有效地实现不同组织间的快速更新传播及数据汇集. 数据联邦/中介服务:可更新虚拟视图支持. 级联更新传播支持:由虚拟的集成数据库提供的应用视图持续信息支持。 谢 谢! * * 网格:支持资源集成与共享,它通过互联网将跨越地域和组织分布的 计算机系统、数据库、仪器设备等各种资源有机地集成为一体,以实现广域范围的共享。 数据网格:支持跨越地域和组织分布的数据集成与共享。 · 数据本身是最重要的共享资源. · 数据网格的建立是实现网格计算的基础和复杂度极高的工作内容。 Michael D. Stefano:《Distribution Data Management For Grid Computing 》 实现多信息源共享,使得任何信息源产生的数据可以被其他信息处理系统有效利用。 ·多种集成方式:多数据库(multi-database),联邦数据库(federated database),数据中介系统(mediator),数据仓库(data warehouse). ·不同数据集藏类型:传统的数据集成研究主要考虑由通用DBMS管理的结构化数据库(如关系数据库,对象-关系数据库等),目前已经扩展到考虑以其他组织形式存在的各种信息资源的集成,如文件系统、网站、文档管理系统和科学数据库等。 统一的全局概念模式,完全的透明访问与全局完整性控制。 通过模式翻译与联合实现在各信息源之间按对等方式(peer to peer)进行无缝互访 通过模式集成支持一个虚拟数据库以提供对多数据源集成数据的透明访问。 来自多个数据源的数据被归并物理地存储在一个系统中,称之为数据仓库。为使数据仓库内容与信息源按照某种相容性要求保持一致,数据仓库必须按照适当的方式进行更新,称之数据仓库维护。 结构冲突 同类的信息内容存在于具有不同组织形式的数据集藏之中. · 模式翻译:XML支持以统一的半结构化数据模型相容地观察这些不同性质的数据存储实体。 · 同构化处理:即使不同的数据集藏使用相同的信息表示方法(数据模型),相同的信息可能被作了不同结构化处理. 一、数据集成与网格 安全互操作性问题: 不同组织信息系统间良好互操作性与内部信息安全性之间的冲突消解。信任管理与内部结构隐蔽 资源独立性: 保护遗产,并使得信息源自主进行的增量扩充与调整不造成对集成平台的影响。 协同开销最小: 信息源为提供组织外互操作性在改造扩充自身系统或抽取与传送信息方面所需消耗的资源(其中包括人力与财力)尽可能小 资源视图层:作为可用信息源的外部抽象观察,起到隔离内部组织结构的作用,并提供数据集成平台的高度资源独立性。 应用视图层:
文档评论(0)