- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Native XML数据库存储研究和应用
Native XML数据库存储研究与应用
[摘要] XML广泛应用于WEB数据的表示和交换,而海量XML数据的存储、处理对传统数据库提出了严峻的挑战,Native XML数据库应运而生,本文重点讨论了NXD数据库数据存储的几个方面,指出其有待进一步研究的问题。
[关键词] XML Native XML Database 数据库
随着Internet进入社会生活的各个方面,电子商务等的广泛应用,关系型数据库在处理信息的复杂化,多样化,差异化,灵活性,可读性等方面的不足日益明显。特别是目前Web Service的蓬勃发展,XML越来越多地活跃在数据交换和存储领域,其数据量指数级的增长,要求更有效的数据管理能力和更快、更精确的查询,而这是传统关系型数据库领域所没有涉及到的,可以说是数据库发展的一个分水岭。NXD(Native XML Database)技术的出现给数据库研究界带来了巨大的机会,如何高效存储管理XML数据也自然成为研究的热点。
一、XML和XML数据库
XML是The Extensible Markup Language(可扩展标识语言)的简写, 具有扩展性、自描述性、自相容性等优点,成为Internet上数据表示和数据交换的标准。
对XML文档进行存取管理和查询的XML数据库分为两类:支持XML数据库管理系统(XED)和纯XML数据库管理系统(NXD)。XED(XML Enabled Database)是在原有关系数据库基础上扩展了XML支持模块,通过适当的XML API对XML文档进行查询和修改,完成XML数据和关系数据库之间的格式转换和传输。NXD(Native XML Database)则出现在XML数据处理领域内,是专门设计用于存储和管理XML文档的数据库,它以XML文档作为数据库的存储单元进行操作和管理,保持XML文档的树形结构,省掉了XML文档和传统数据库的数据转换过程。
二、NXD的概述
1.NXD定义
RonaldBourret在“XMLandDatabases”一文中给出有关NXD的定义。一个纯XML数据库是指:(1)相对于XML文档中的数据,定义了XML文档的逻辑模型,并且按照该模型来存储和检索文档。这样的模型至少应该包括元素、属性、PCDATA以及文档顺序。(2)就像关系数据库以行作为表的逻辑存储基本单位一样,NXDBMS以XML文档作为NXD的逻辑存储基本单位。(3)不要求有任何特殊的基本物理存储模型,它可以建立在关系的、层次的或面向对象数据库之上,或者使用诸如索引文件、压缩文件此类的专门存储格式。
但在很多方面,XML应不同于关系模型和面向对象模型等数据模型,将XML映射到另一种数据模型常常引起“阻抗失配”,并导致功能和性能上的局限。因此,业界提出NXD必须直接存储和处理XML数据。
2.NXD特性
纯XML数据库的特性有:(1)文件集(Document Collections):支持集合(Collection)的概念,集合级别上的查询,修改操作都会反映到集合内的每个文档中。(2)查询语言(Query Languages):目前主流的是XPath,但其存在不能分组,排序和连接等缺陷,因此 XQuery作为Xpath的替代品,有希望成为纯XML数据库的专用语言。(3)更新和删除(Updates and Deletes):NXD 绝大多数产品在这方面仍是薄弱环节。(4)事务、锁定和并发(Transactions,Locking,and Concurrency);支持事务处理。锁定通常是对整个文档的,所以多用户并发性相对较低。(5)纯XML数据库提供良好的编程接口。(6)能够高效而精确的还原XML文档。
三、NXD数据存储结构
1.物理存储
将元数据、XML数据、索引和统计数据如何放置在物理磁盘上永远是一个挑战性的问题,因为底层的存储表达对上层的查询处理和优化有着重要的性能影响。
纯XMl数据库在物理上存储XML文档主要有三种方案:
(1)字节流方式:即将XML数据转换为字节流,这种方式将文档转换为字节流,然后将其存储在文件系统的文本文件中或存储为数据库的BLOB字段中,然后在这些文件或字段上面加一些索引,通过这种方式来提供某些数据的功能,当存储和检索整个文档时,这种方式效率较高,并且能够精确地再现原来的XML文档,但缺点在于任何一次查询文档时都必须通过分析器处理后才能获得结构信息。
(2)元模型方式:即按照某种物理模型存储XML文档,这里模型的不同,分为两种方案,一种是采用现有的关系数据库或面向对象数据库作为XML数据的存储库,在重组文档片段或不同文档时比较快,但在逻辑层和物理层
原创力文档


文档评论(0)