XML数据查询处理技术研究综述.docxVIP

  • 3
  • 0
  • 约5.7万字
  • 约 19页
  • 2019-01-03 发布于广东
  • 举报
XML 数据查询处理技术研究综述1 王宏志 ,李建中 哈尔滨工业大学计算机科学与技术学院,哈尔滨 (150001) 摘 要:由于其可扩展性和灵活性,越来越多的数据以 XML 的形式存在,XML 已经成为 Web 上数据表示和交换的标准。作为一种半结构化数据,XML 数据的高效处理带来了新的挑战。 XML 数据管理已经成为数据管理中的一个重要的研究领域。XML 数据管理中一个重要问题是如何对各种形式的 XML 数据进行高效的查询处理。当前 XML 数据查询处理已经成为数据管理研究的热点,有大量技术提出。本文针对树结构 XML 文档、图结构 XML 文档、XML 数据流和基于 XML 的信息集成系统这四类 XML 数据的主要存在形式,对这些形式 XML 数据上的查询处理技术进行综述。并提出了当前需要进一步研究的问题。 关键词:XML 查询处理 查询操作 查询优化 中图分类号:TP311.13 1.引言 可扩展置标语言(EXtensible Markup Language,简称为 XML)[141]是一种为电子信息发布而设计的标记语言。由于其可扩展性和灵活性,XML 逐渐成为 Web 和其他一些信息系统中数据表达与 转换的重要标准。XML 在以下各个方面均有着广泛的应用。 数据交换 XML是应用程序之间、公司之间数据进行交换的标准。已经出现许多应用领域中的以XML为基础 的数据描述标准。这些标准使得同行业的不同系统,不同组织之 间的数据可以交换和共享。比如描述数学数据的MathML[32]、电子商务中的eBXml[7]、金融行业的XBRL[9]、FPML[5]、描述图形的SVG[64]、描述地理信息的GML[6]等。 Web 服务 XML数据是Web服务的基础。作为web服务核心的协议SOAP[79] 、WSDL[46]和UDDI[50]都基于XML。 内容管理 XML数据可以用作内容管理的基础。XML只用元素和属性来描述数据, 而不提供数据的显示方法。这样,XML就提供了一个优秀的方法来标记独立于平台和语言的内容。使用象XSLT[48]这样的语言能够轻易地将XML文件转换成各种格式文件。XML能够运行于不同系统平 台之间和转换成不同格式目标文件的能力使其成为内容管理应用系统中的重要格式。 知识管理 由于XML数据可以表达具有复杂结构的数据,因而知识管理中的重要标准也以XML为描述的形式。比如RDF[23],OWL[114]等作为语义网基础的标准都是以XML为基础的。 信息集成 XML既可以表达结构数据,也可以表达半结构数据, 因此XML可以用做多种类型数据源中信息相互转换的中间形式,从而XML数据可以有效地支持多种数据源的信息集成。 软件配置 由于有着表达语义的标签,XML在软件的配置文件中有着广泛的应用。使用XML配制文件的应用程序能够方便地处理所需数据,不需要重新编辑就可以轻松地修改和维护系统。 半结构化数据管理 由于XML具有表达半结构化数据的特性,XML数据库可以用来对其进行管理,支持其上的查询处理。DB2[89]、SQL Server[134]、Oracle[100]等主流数据库系 Supported by the National Natural Science Foundation of China under Grant Nos(国家自然科学基金); the National Basic Research Program of China under Grant No.2006CB303000 (国家重点基础研究计划(973)) -1- 统都提供了对XML形式数据的支持。还有许多native XML数据管理系统也已经推出,比如Ipedo[8]、Tamino[137]、Natix[65]、Xyleme[14]等。 由于 XML 形式数据在很多应用中存在,而且数据量越来越大,对其进行有效地管理成为一项必不可少的工作。在实际应用中 XML 数据有不同的存在形式,主要可以归纳为以下 类: 树结构XML文档 在很多应用中,一个XML文档可以看成是一棵有序的,有标签的树,其中元素或属性映射为树中的结点,元素之间的嵌套关系映射为边。 图结构 XML 文档 在一些应用中,考虑到元素之间可能存在引用关系 (id 与 idref[141]),一个XML文档可以看成是一个有标签的图,其中元素或属性映射为图中的结点,元素之间的嵌套关系以及引用关系关系映射为边。这样的应用包括语义网络、RDF[20]等。 XML数据流 在很多应用中,如网络信息订阅与发布、电子邮件监测等,XML以数据流的形式存在。XML数据流是一种按照时间顺序实时到达的无限流数据。XML数据流的特点是仅允许一次并

文档评论(0)

1亿VIP精品文档

相关文档