面向XML结构查询的标签位图过滤加速技术研究.pdfVIP

面向XML结构查询的标签位图过滤加速技术研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向XML结构查询的标签位图过滤加速技术’‘‘ 李志云1周国祥2 l山东信息职业技术学院,山东潍坊26104l 2合肥工业大学计算机与信息学院,安徽合肥230009 结构查询作为其核心部分。高效的xML结梅查询处理在xML数据管理中非常重要。本文提出了一种 位图过滤加速法。利用前/后缀标签位图,该方法能加速多类查询匹配算法。本文给出了过滤加速原理, 并研究了位图过滤加速法与查询匹配算法的集成。 关键词:XML结构查询标签位图 1引 言 等,都以xML结构查询作为其核心部分。因此,高效的)aⅥL结构查询处理在xML数据管理中非常重要。 在xML结构查询研究中,除了xML路径查询匹配算法之外,另一个重要的领域是xML路径匹配加 速技术。XML路径匹配加速技术利用一些辅助数据结构,提高已有Ⅺ订L路径匹配算法的查询效率。XML 路径匹配加速技术主要分为两类:空间约简技术和空间跳跃技术。空间约简技术减少查询空间冗余,从而 加速XML路径匹配,如DataGuideI训、摘要图驯【oJI¨等。 空间跳跃技术通过跳跃非匹配候选节点加速XML路径匹配。XML结构索引一般属于此类。原有的空 本文提出一种新的空间跳跃技术:标签位图过滤。不同于己有的许多加速技术,标签位图过滤能加速多种 XML路径匹配算法。该加速技术与原有的索引类加速技术【89J存在正交关系,可以同时使用。结合频繁存 取标签名集概念,标签位图过滤技术能保证以较小额外空间开销换取较大匹配效率提高。 2标签位图 位图过滤加速法首先为XML文档树中的每个节点建立两种标签位图:前缀位图和后缀位图。前缀位 图表示当前节点的祖先节点标签名集;后缀位图表示当前节点的子孙节点标签名集。在XML结构化匹配 中,通过标签位图比较操作,能过滤大量未匹配候选节点,从而减少匹配次数。使用位图基于如下目的: 使用位图表示标签名集,可以减少存储开销;位图比较采用位操作,快于字串比较。为了进一步减小位图 的存储开销,本文又采用了基于频繁存取标签集的压缩技术。 位图过滤加速法是一种通用XML结构匹配加速方法,可以与多数结构匹配算法相集成。本文将只描 。基金资助:国家自然科学基金重点项目州O. 作者简介:李志云(1969一),女,山东潍坊人,硕士,讲师,主要研究方向:计算机软件与理论;周国祥,男,安徽合肥人,合肥 工业大学教授,主要研究方向:计算机软件与理论. 述位图过滤与连接类(Join-b笛ed)算法的集成。 2.1预备定义 定义l标签名编号 遵照前序遍历,为)(1帆文档中的所有标签名编号,从1开始。公式为: tid∈N r:tagn棚frIe—tid 定义2有序标签名集 签名个数。 定义3前缀路径 给出xML文档树中的节点V,它的前缀路径PPv为从树根到该节点的输入路径(incomingpath)。 定义4后缀子树 给出xML文档树中的节点v,它的后缀子树SB。为以节点v为根的子树。 定义5标签名列表 在Xl札文档树中,给定一个节点集S,它对应的标签名列表TNLs为标签名集的一个有序子集,其形 列表为{title,ch印ter,section,teXt)。 2.2标签位图 b。豳夕加k~b溅 b。okl/\b0哟 删。/銎》蜥11。卜、慨 鼬/蝥涂‰0011卜\p。劬 也众眦咖 k 龇白/\…。 ∑如 1101110 ll∞11l n)翦瑚 恤lcl雠1c. n“若糊 1lol叩0&叭叭1000≠0101000谶 b00kl 硼句 n崦

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档