动态XML编码技术地研究.pdfVIP

  • 2
  • 0
  • 约6.65万字
  • 约 61页
  • 2016-05-11 发布于江苏
  • 举报
摘要 随着网络应用的快速发展,ⅪV匝(eXte眦ible MarkupL觚guage)数据正成为主 流的数据形式,如何对Ⅺ儿数据建立有效索引进而实现高效查询是当前的研究 热点。大部分)①几相关索引和查询技术基于某种对XML树的编码方法。XML编 码方法保存了文档树的结构信息,使得在执行查询时不必遍历整个Ⅺ帆文档。 传统的区间编码方法和前缀编码方法支持龇节点间位置关系和结构关系计 算,但是不能有效处理文档更新,一旦更新发生,整个树需要重新编码,系统代 价高。为解决该问题,研究人员提出了动态XML编码方法,包括浮点数区间、 CDBS(CompaCt S仃吨)、QED(D),namic Dyn撇ic胁q Quat锄哪Encoding)以及 DDE(DynanlicDewey)等。动态Ⅺ儿编码方法一定程度上避免了文档更新时的重 新编码,但仍存在时空开销大、对倾斜插入敏感、不能重用已删编码等问题。本 文研究集中于动态Ⅺ儿编码机制的性能优化。 首先,XML文档更新涉及节点插入和删除,当在删除位置插入新节点时, 如果新节点能够对已删编码进行重用,则可以控制编码长度的增长速度,提高查 询性能。CDBS和QED的编码重用已经有相关研究,而对于DDE编码,却是一 DDD。ⅢD将最短位长中间编码赋予新节点,能够对已删编码进行重用,有效 控制了删除和操作都发生的更新环境下DDE编码位长,提高了Ⅺv几频繁更新 时的编码效率和查询性能。 此外,针对已有动态区间编码方法普遍存在的初始编码空间复杂度高,倾斜 插入编码长度增长迅速等问题,本文提出了新的适用于舭文档更新环境下的 Containment 区间编码方法——DCLS(DynanlicLabeliIlgSch锄e)。DCLS利用整 数进行初始编码,具有计算简单,额外空间复杂度低、存储效率和查询性能高等 优点;同时,DCLS将整数视为特殊向量,不仅支持文档更新,而且更新效率高, 特别是倾斜插入时,DCLS可以避免编码位长的快速增加。 实验结果表明,相比于已有动态)(】儿编码方法,DD和DCLS有更好性能。 关键词:Ⅺ儿文档更新;动态编码方法;编码重用;向量序 Abstract ofhtemet.based w池the:硫reaLsiIlg application,more觚d 舢ong deVelopment inf0衄a_cionis and inXMLfomat.1k more beir蟮stored,eXchaIlgedpresented datas0Wcesbecome abilit),t0e伍ci饥tly越cx锄dqueDr删L increasin班y arebased0n of)m几iIldexiIlg锄dqueD,iIlgtechlliques label堍 iInportant.Most t0 nodes∞matbotllordeI.cdand sclleIneswllichare labeltheXML desi弘ed un-orderedc觚be witllout tlle XMLfile. quefieS prcHceSsed accessingori百nal T}aditionalcont妇entl scheme tlle

文档评论(0)

1亿VIP精品文档

相关文档