- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于XML的异构数据库查询中间件的实现
北京市高等教育自学考试毕业设计
基于XML的异构数据库
查询中间件的实现
专 业 计算机及应用
学 生 MMM
指导老师
日 期 2006年10月
论文摘要
外交部各部门在实施数据管理系统,从简单的文件数据库到复杂的网络数据库,构成了异构数据源。
目 录
论文摘要 2
目 录 3
第一章 概述 5
1.1 论文选题背景 5
1.2 国内外发展现状 5
1.2.1当前数据集成方案 5
1.2.2 国内外研究现状 7
1.3 论文目标 8
1.3.1论文要实现的目标 8
1.3.2 XML技术的引入 9
1.4 论文的组织结构 9
1.5 本章小结 10
第二章 中间件设计方案 11
2.1 主要架构 11
2.2 系统目标 12
2.2.1 软件架构 13
2.2.2视图层次 14
2.2.3 功能模块 14
2.3 中间件工作流程 16
2.3.1 用户输入查询请求 16
2.3.2语法树的生成 16
2.3.3 查询计划树的生成 17
2.3.4 查询计划树的重写 18
2.3.5 查询计划树的优化 18
2.3.6 查询分解 20
2.4 冲突的解决 20
2.4.1 冲突的类型 21
2.4.2 异构数据库冲突的解决方法 21
第三章 中间件的实现 23
3.1 语法树的生成 23
3.1.1 LEX 和 YACC 的使用 23
3.1.2 语法树的生成 24
3.2 计划树的生成 26
3.3 查询分解的实现 28
3.4 数据类型的统一 32
3.5 用户界面 32
第四章 总结 34
4.1 论文总结 34
4.2 心得体会 34
4.3 进一步工作 35
第一章 概述
1.1 论文选题背景
外交部各部门在发展过程中积累了大量数据,并为存储和管理这些数据不断投资,然而,由于实施数据管理系统的阶段性,以及计算机存储技术的不断发展,和人为因素的影响,以至于大到部门间的系统、小到一个处内的各个系统都可能采用不同的数据管理系统,从简单的文件数据库到复杂的网络数据库,它们构成了异构数据源所以,无论是从发展角度还是从的角度来看,异构数据建立异构数据的集成
1.2 国内外发展现状
1.2.1当前数据集成方案
一、联邦数据库系统
集成几个数据库的最简单的结构可能是实现需要交互的所有数据库对之间的一对一连接。这些连接允许一个数据库系统DB1以另一个数据库系统DB2能理解的术语来查询D2。这种结构的问题是,如果n个数据库中的每一个都需要与其他n-1个数据库进行交互,则我们必须写n(n-1)条代码以支持系统之间的查询。
图1.1 联邦数据库模型
二、数据仓库
在数据仓库集成结构中,来自几个数据源的数据被抽取出来,合成一个全局模式。然后,数据存储在数据仓库中,这在用户看来与普通数据库无异。组织方式如图1.2所示。
一旦数据存储在数据仓库中,用户就可以提出查询,正如他们向任何数据库提出查询一样。另一方面,通常不允许用户对数据仓库进行更新,因为这些更新不能反映在基本数据源中,并且可以导致数据仓库与数据源不一致。此外,数据仓库中的内容需要周期性的更新,以保持和数据源里的数据一致。
三、Mediation。Mediator是一种软件组件,它支持虚拟数据库,用户可以查询这个虚拟数据库,就像它已物化一样。Mediator不存储任何自己的数据,而是将用户的查询翻译成一个或多个对数据源的查询。然后,Mediator将那些数据源对用户查询的回答进行综合处理,将结果返回给用户。其基本结构如图1.3所示。
图1.3 Mediator模型
Mediator负责把查询分发到各个包装器,包装器然后把查询转换成本地数据源可以理解的模式。Mediator本身不对查询进行任何解释。Mediator对包装器返回的结果进行合成。
按照这个理论来讲的话,对于需要集成的数据源,为每个数据源都要设计一个包装器,或者说为一类数据源(关系数据库、XML、web数据)设计一个可动态配置的包装器。
这种方式存在的问题:既然Mediator不对查询进行解释,那么这种对数据源的集成就无法考虑到数据源之间数据的特殊的联系。因为每个包装器只了解自己数据源的内容,Mediator只负责把各个包装器返回来的数据进行的组合。
1.2.2 国内外研究现状
异构数据库集成并不是一个新的研究领域,随着XML技术的采用,该领域又重新成为了研究的热点。
从采用基于XML技术的中间件来集成异构数据库或异构信息的角度来看,目前,相关研究主要集中在国外。
美国政府在1998年通过OPAL计划开始支持YAT(基于中间件的信息集成系统)的研究,该系统Mediator/Wrapper中间件框
文档评论(0)