网站大量收购独家精品文档,联系QQ:2885784924

XML 数据库能测试系统的设计5.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
XML 数据库能测试系统的设计5

XML 数据库Abstract: As XML becomes the data exchange standard of Internet gradually, many database vendors have been offering database products to manage large amount of data effectively. Then, how to evaluate the performance of these databases becomes one of the most important problems for user to choose products. In this paper, a new set of indicators was proposed. It was based on the traditional performance indicators, combined with the characteristics of XML data. And it also designed a test system and performed it in DB2 V9.5 and Oracle 10 G. Keywords: XML database;Performance Testing;Indicator 摘要:随着XML逐渐成为Internet上数据表示与数据交换的标准,为了有效管理大量XML数据,各数据库厂商纷纷推出支持XML数据的数据库产品。如何对这些数据库产品的性能进行评价成为用户选择的难题之一。本文基于传统的数据库性能指标,结合XML数据库的特点,提出了一套新的指标体系,并对测试系统进行了设计,最后在DB2 V9.5和Oracle 10 G上进行了验证。 关键词:XML 数据库;性能测试;指标 1 引言 随着电子商务等的广泛应用,关系型数据库在处理信息的复杂化、多样化、灵活性、可读性等方面的不足日益明显。特别是目前Web Service的蓬勃发展,XML越来越多地活跃在数据交换和存储领域,其数据量指数级的增长,要求更有效的数据管理能力和更快、更精确的查询,而这是传统关系型数据库领域所没有涉及到的。 XML作为可扩展标记语言, 具有扩展性、自描述性、自相容性等优点,日益成为Internet上数据表示和数据交换的标准。为了有效管理大量XML数据,各数据库厂商纷纷对他们的数据库产品进行了功能扩展以满足处理XML数据的需求。当前有很多不同技术种类的XML数据库系统,比如文献[1]中提到的XML-Enabled Database,Native XML Database, XML Query Engine等,既有众多的商业系统,比如文献[2]和文献[3]中的Tamino,也有许多开源或者原型系统,比如Xindice和OrientX。这些XML 数据库良莠不齐, 2 XML数据库性能评价方法 2.1 性能评价指标 传统的数据库性能测试一般以查询响应时间或吞吐量作为性能指标。例如在TPC-C基准测试中,主要依靠吞吐量来评价数据库性能,其指标有: 流量指标(Throughput,简称tpmC) 按照TPC的定义,流量指标描述了系统在执行Payment、Order-status、Delivery、Stock-Level这四种交易的同时,每分钟可以处理多少个New-Order交易。所有交易的响应时间必须满足TPC-C测试规范的要求[4]。 性价比(Price/Performance,简称Price/tpmC) 即测试系统价格(指在美国的报价)与流量指标的比值。 但是这些指标并不能满足XML数据库的要求。在存储方面,XML文档以复杂或无规则的结构和混合内容为特征,而且文档的物理结构非常重要;在索引方面,XML数据库必须建立从标记值或属性值到元素偏移量的映射;在查询方面,XML查询语言如XPath和XQuery将路径表达式作为核心内容,对数据进行导航式的遍历。 综上所述,单一的流量指标并不能衡量XML数据库的性能,还需考虑更多因素,建立新的指标体系,才能提高性能评价的准确度。本文基于上述特征,从XML文档建立、索引建立、吞吐量和插入操作四个角度出发,设计了以下四个指标: 文档建立时间 描述在数据库中建立XML文档时,建立一个XML文档所需要的时间。 索引创建时间 描述在数据库中建立索引时,建立全部索引所需要的时间。 流量指标 描述数据库在处理基本事务时,每分钟可以处理多少事务。 插入操作量 描述数据库在进行插入操作时,每分钟处理的插入操作量。 2.2 性能基准测试工具 性能基准测试是指根据性能基准设计检测程序,搭建检测环境,进行性能测试,并把检测结

文档评论(0)

weg665 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档