一种基于扩展区间编码的结构连接算法TwigELM.docVIP

一种基于扩展区间编码的结构连接算法TwigELM.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于扩展区间编码的结构连接算法TwigELM   摘要:由于XML具有格式良好,自描述,可扩展等优点,使得XML成为网络上信息表达和数据交换事实上的标准。随着XML格式数据的广泛应用,如何有效地存储和查询XML格式数据成为当前研究的热点。为了有效支持XML结构查询,研究者已经提出了XML数据的各种编码方案。通过编码的方式将XML结构查询的计算转化为结构连接的计算。该文提出了一种新的XML文档树编码方案,并基于该编码方案给出了一种新的小枝模式查询算法TwigELM,实验表明,该算法可有效提高结构连接操作的效率。   关键词:XML;结构连接;小枝模式;编码方案   中图分类号:TP311文献标识码:A文章编号:1009-3044(2011)11-2495-03   A Structural Join Algorithm TwigELM Based on Extended Interval Coding   SUN Qing-tao, LU Yan   (College of Information Science and Engineering, SUST, Qingdao 266510, China)   Abstract: Because XML has a well-formed, self-describing, extensible, etc., make the XML information into the network expression and the de facto standard data exchange. With the extensive use of XML formatted data, how to store and query data in XML format to become a research focus. In order to effectively support the XML structure of inquiry, researchers have proposed a variety of XML data encoding scheme. By way of coding the query XML structure into a structure of connected computing calculations. This paper presents a new XML document tree coding scheme and coding scheme based on the given model, a new Twig query algorithm TwigELM, experiments show that the algorithm can effectively improve the efficiency of structural join operation.   Key words: XML; structural join; twig pattern; coding scheme   XML文档树的编码方案可以分为两大类:基于区间的编码和基于路径的编码。前者是利用XML文档的有序特点,根据每一个元素结点在原XML文档树中字典顺序的位置给每一个元素结点赋予一个编码;后者则是利用XML文档的嵌套的特点,根据XML文档的嵌套结构,给从文档根节点开始所能到达的每一条路径和元素结点赋予一个编码[1]。   到目前为止,国内外已经提出的编码方案主要包括:前缀编码、区间编码和二叉树编码等。本文主要研究的是区间编码,提出了一种新的XML扩展区间编码Extended Li-Moon。   1 相关研究   XML文档树中的每一个结点被赋予一个区间编码[start,end],并且满足:一个结点的区间编码包含它的后裔结点的区间编码,即如果结点x是结点y的祖先,当且仅当start(x)start(y)∧ end(y) end(x)。   文献[3]给出了第一种区间编码方案,称为Dietz编码。编码规则是:XML文档树中的每一个结点被赋予一个先序遍历序号和后序遍历序号的二元组。pre和post分别是结点的先序和后序遍历序号。   Li和Moon在文献[4]中提出了第二种区间编码方案,称为Li-Moon编码。编码规则为对XML文档树的每一个结点赋予一个三元组。Order是结点的扩展先序遍历序号,取值是非连续的;size是结点的后裔范围;depth表示该结点在文档树中所在的层数。该编码方案中,判断结点x是结点y的双亲的充要条件是:order(x)order(y)∧order(y) ≤order(x)+

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档