基于XML数据库统一研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于XML数据库统一研究

基于XML数据库统一研究   [摘要]讨论如何利用关系数据库存储XML数据和文档,如何利用关系毅据库直接支持XML毅据查询,最终建立一个基于XML的、统一的Internet数据库平台的方案。XML存储管理和XML搜索引擎是实现XED的核心问题。   [关键词]XML 数据库 存储管理 搜索引擎   中图分类号:G2 文献标识码:A 文章编号2008)0610046-01      一、综述      XML被称作是Internet上的世界语。XML技术的诞生就是为了统一不同格式的数据,实现不同系统之间的信息共享,增加系统价值。基于XML技术,还衍生出很多新的技术,如Web Service。和XML数据库等。基于以上原因,XML数据库自然成为一个研究热点。目前对XML数据库的研究主要有两种思路:一是研究纯XML数据库,称作NDX;二是依托于关系数据库来实现XML数据库的功能,称作XED.   XML数据库的典型应用包括以下六种:   数据交换:用XML统一表示来自不同数据源的数据,实现系统间的数据交换,实现信息共享。   Web应用和服务:用XML表述数据内容,通过XSLT将其转换成任何表现形式(HTMLPDF/Word等)。   信息集成:对遗留系统的整合集成是企业面临的一大难题。通过XML统一表示数据,完成对不同系统的信息集成。   内容管理:内容管理会涉及大量的半结构徘结构化数据,处理结构化数据的关系型数据库处理这类数据就显得束手无策。   电子商务:电子商务平台要完成和企业现有系统互联、不同交易方的数据交换,实际上是对以上应用的综合。国内外关于电子商务的XML标准包括ebXML,cnXML等。   电子政务:电子政务急迫要解决的问题是如何将各政府部门现有分离的系统互连起来,解决信息孤岛问题。   如何有效的解决“孤岛”问题使电子政务系统上的数据畅通无阻则是需要优先解决的问题。      二、XML数据库要解决的基本问题      Internet上的数据库各种各样,并且大部分都是关系数据库,由于数据库是异构的,所以给数据交换带来很多困难,而XML技术的诞生就是为了统一不同格式的数据,实现不同系统之间的信息共享,增加系统价值。那么随之而来的问题是大量新产生的XML数据和文档如何管理,又如何查询。答案当然是建立XML数据库。   如何利用关系数据库存储XML数据和文档,如何利用关系数据库直接支持XML数据查询,最终建立一个基于XML的、统一的Internet数据库平台是数据库研究者和数据库厂商这几年致力于研究的问题。   XML数据库的内部存储模型应该与XML文件层次模型一致,存取XML文件时,无需将其拆散重组,这样才更加灵活高效。同时还要具有事务管理、安全、多用户访问、编程API和查询语言等传统数据库技术,还要支持W3C关于XML技术的最新标准。   一般XMI‘数据库研究的具体内容包括以下几个方面:XML数据的存储技术,XML数据的索引技术,XML数据的解析和内容管理技术,基于XML的数据交互和数据集成技术及XML数据的查询和发布技术。   一般基于关系数据库的XML数据存储,在文档存入到数据库时需要将其拆解,取出时需要重新组装,这样做不仅耗时,文档的格式可能会发生改变,并且不能完全支持XML的特征。能否在XML数据的特征提取、数据分类、索引技术、查询技术和存储技术等方面做出新的研究和尝试,实现基于关系数据库的真正的XML数据存取和内容管理,是要解决的基本问题。      三、研究的思路和方法      XML数据库的研究方法主要分为两大类:一是研究纯XML数据库,称作NDX;二是基于现有的关系数据库来实现XML数据库的功能,称作XED。我们讨论第二种方案,这也是目前学术界比较认同的技术方案。   目前国内外关于XED的研究主要采取的方法是将XML文档映射到关系,这样做的结果是在XML文档存人到数据库时需要将其拆解,取出时需要重新组装,从而对XML的支持打了折扣,效率也比较低。我们提出虚拟数据库的方案,前台呈现在用户面前的是RDB+NDB,后台是RDB支持的XED。特别是后台实现的XED,不将XML文档映射到关系,直接实现XML文档的内容管理,从而可以获得关系数据库和XML数据库的全部特征和支持。   其中XML存储管理是实现XED的难点。对XML文档抽取的特征、规则等存储在关系数据库中,而对XML文档本身的存储则需要研究特殊的存储技术。例如可以借鉴一般数据库大对象的存储技术,建立操作系统一级的文件,使这些文件属于特定的数据集,并用特殊的ID来标志,在文件上进行适当的逻辑分块和物理分块。   XML存储管理要支持不同的存储策略。既要适应有模

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档