基于XML和XQuery的数据集成框架研究-计算机技术专业论文.docxVIP

基于XML和XQuery的数据集成框架研究-计算机技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
华南理工大学 华南理工大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所 取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的 法律后果由本人承担。 作者签名:瞄雪.免 日期:刀口f年,五月,}日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校 有权保存并向国家有关部门或机构送交论文的复印件和电子版,允许学位 论文被查阅(除在保密期内的保密论文外);学校可以公布学位论文的全 部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位 论文。本人电子文档的内容和纸质论文的内容相~致。 本学位论文属于: 口保密,在 年解密后适用本授权书。 囤不保密。 学位论文全文电子舨提交后: 口同意在校园网上发布,供校内师生和与学校有共享协议的单位浏 览。 (请在以上相应方框内打“√”) 作者签名:绍等乞 日期:翮6,/2·弓 指导教师签名: :磊叭 日期:御莎.J。-; 第一章绪论第一章 第一章绪论 第一章 绪论 1.1研究的背景 很多企业在发展过程中,都开发或引进了许多独立运行的应用系统,每一个应用 系统都有自己的运行环境和数据存储方式,从而产生了各种不同的数据源。而且随着市 场的变化、客户需求的变化,企业还在不断地增加它的应用。各个应用系统彼此封闭,数 据不能交换和共享,数据源之间数据格式和代码不统一、数据大量冗余,从而形成了大 大小小的“信息孤岛”“1。 如何能更好的利用企业原有的数据资源,已经成为人们R益关心的问题。数据集成 系统在其中扮演十分重要的角色,成为近年来的研究课题之一嘲。比如对多数据库系统 (multi—database)的研究,以及对Web环境下的数据集成研究”1。根据IDC公司的最新 调查结果显示,到2007年全球的数据集成项目预算将达到109亿美元,相比2002年的 73亿美元增长了5096“1。 数据集成也被称为信息集成(Information Integration)、信息中介(Information Mediation)或信息搜集(Information Gathering)等。目的是提供一个访问异构数据源 的统一接口,使用户不需要考虑数据模型的异构性、数据抽取、数据合成等问题,用户 只需指定他们想要的数据,而不必描述怎样得到数据,从而复杂的源数据对用户彻底“透 明”。提供这种功能的平台叫做数据集成平台,如图1.1所示。 操作指令I 结果 ~。 1l 数据集成平台 / , \ 栅商囱 .商 图1.1数据集成平台基本结构 数据集成平台提供了底层数据源存储数据的统一视图(全局模式),这样用户访问 所有数据源就像操作一个数据源一样。同时,数据集成平台还提供全局数据管理,模式 华南理I:人学硕十学位论文转换与集成、全局查询处理等功能解决数捌的片构性|.uJ题,完成从实助:数掘源到数捌源 华南理I:人学硕十学位论文 转换与集成、全局查询处理等功能解决数捌的片构性|.uJ题,完成从实助:数掘源到数捌源 视图的转换,在应用构件之间充当数掘总线的作用。 1.2研究问题现状 1.2.1探讨的问题领域 多个数据源上的集成所要解决的问题是纷繁复杂的,总的来说这些问题集中在以下 几个方面: (1)异构性 由于数掘集成面对的是多个已存在的数掘源,不同数掘源之『白J从底层系统到上层架 构都千差力.别,这就必然带来了处理异构性的要求。具体的说异构性包括了以下几点: a)系统异构 数据源所依赖的底层硬件平台、操作系统、应用系统、数掘库管理系统及网络协议 之间的不同构成了系统异构性; b)模式异构 数据源在存储模式上各不相同。目前的存储模式包括有关系模式、对象模式、对象 关系模式、半结构化模式和文档模式。不同的应用会根据自己的需求选用各自的存储模 式; c)数据结构异构 数据集成涉及的数据源可以为一个,也可以为多个。不同的数掘源由于设计者不一 样,故在表结构,表的语义,表中属性的构成,属性等诸多方面都存在着异构”。还有 如文献[6]描述的域异构等。 (2)数据完整性 为了满足各种应用对要处理的数据的要求,集成后的数据一定要保证完整性,包括 数据完整性和约束完整性。数据完整性是指提取数据本身,一般来说这点比较容易达到; 约束完整性是指数掘与数据之间的关联关系,是唯一表征数掘问逻辑的特性。保证约束 的完整性是良好的数据发布和交换的前提,可以方便数据处理过程,提高效率。对于好 的集成来说,数据完整性和约束完整性都是必不可少的。 (3)性能 网络时代的应用对传统数据

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档