纯XML数据库存储性能的研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
西 安 工 程 大 学 学 报 JournalofXi’anPolytechnicUniversity 第24卷第4期(总 104期) 2010年8月 Vo1.24,No.4(Sum.No.104) 文章编号:1674-649X(201O)04--0506-04 纯 XML数据库存储性能的研究 吴晓葵 (西安航空技术高等专科学校 现代教育技术中心,陕西 西安 710077) 摘要:针对XML数据存储在文件系统、NativeXML数据库和 XML—enabled数据库 中性能的差异, 基于3种 XML数据存储方式的基本原理,提出了以查询响应时间为性能指标,以XMark为基准 测试工具的性能评价方法.设计并完成了文件系统和 Xindice系统的对比实验 ,并根据实验结果 明确 了不同应用系统适用的XML存储方式. 关键词 :XML;存储 ;基准测试 中图分类号 :TP311 文献标识码 :A 互联网上数据量的不断增加使得原来 由HTML所架构出的Web开始暴露其功能的不足,因此 自1998 年2月W3C制定扩展标记语言XML(eXtensibleMarkupLanguage)标准以来,XML作为一种数据描述语 言,因其强大的可扩展性、自描述性和易于交换性,被学术界广泛研究.XML规范 ¨是由W3C组织制定的 一 个数据描述语言的标准,其具有 自描述性 良好的数据存储格式、可扩展性、高度结构化、内容与形式分离 等优点.XML支持多语系和Unicode,在任何系统与硬件平台上都可以读取XML,不用担心兼容问题. XML的应用发展迅速,如中问件技术、XML—enabled数据库、NativeXML数据库、XML服务器、XML应 用服务器、内容管理系统、可持久化的DOM实现和XML查询机等 ].其中,XML在数据库中的存储方式 对XML的实用性能有着直接的影响,如何从众多的方案中选择合适的一种,性能是需要考虑的问题.因 此,本文提出评价指标、评价方法及实验设计,比较不同存储方式对XML性能的影响,进行定性和定量的 研究,对于在不同应用要求下选择何种存储方式具有一定的参考意义. 1 存储方式 目前主流的XML数据存储方式可以归结为文件系统、XML—enabled数据库和纯XML数据库 (Native XMLDatabase,NXD)等3种.文件系统是把XML文档以“文件”的形式按层次存放在相应的文件夹内,通 过操作系统自带的文件管理系统来管理其中的XML数据.早期的XML数据多以这种方式存储,以关键字 查询等信息检索手段进行查询,简单易用,适合XML文档数据量不大且不频繁更新的场合.由于缺乏系统 的存储和查询机制的支持,文件系统查询能力低,不能满足复杂条件的查询. XML—enbaled数据库是对现有关系数据库的改造,主要是通过增加一个映射层,使其支持对 XML数 据的管理,它的基本存储单位是XML文档所提供的数据.存人时,根据预先定义的规则,把XML数据映射 成表格(即关系)形式,处理过程则借助于关系数据库技术;输出时,又将表格映射成XML文档形式.目前 收稿 日期 :2010-05-10 作者简介:吴晓葵(1968.),男,湖北省大冶市人,西安航空技术高等专科学校副教授,硕士.E-mail:wuxiaoku3/85@163.eom 第4期 纯XML数据库存储性能的研究 对于复杂XML文档的完整映射是很困难的,这种方法在一定程度上解决了查询复杂性的要求,但是多次 转换带来的问题是效率的降低和查询语义的混淆,即阻抗失配的问题.此外,面向对象数据库也支持对 XML数据的存储,但技术尚未成熟. NXD的基本存储单位是XML文档,数据管理均在半结构化特点下进行.纯 XML数据库管理系统 (NXDBMS)以自然的方式处理XML数据,没有因数据模型转换而带来信息丢失和性能下降.Xindice3【就 是一种典型的NXD,它是Apache的一个开源项 目.其中数据以 “集合 (Collection)”为存储单元,集合中可 以导人若干个 “文档(Document)”,使用XPath查询、使用X

文档评论(0)

向往 + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档