网站大量收购独家精品文档,联系QQ:2885784924

一种新的高效XML树编码方案.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种新的高效XML树编码方案

微 计 算 机 应 用 M ICROCOM PU TER A PPL ICA T ION S 第 29卷第 12期 2008年 12月 Vo l129 No112 D ec12008 一种新的高效 XML 树编码方案 魏东平 宗德君 孙华国 (中国石油大学 (华东 ) 计算机与通信工程学院 计算机科学技术系 东营 257061 ) 摘要 :在深入分析现有 XML 编码方案基础上 ,提出了一种新的编码方案 —PSB ,该方案能够快速准确地判断出 XML 文档结构 树中任意两个结点之间的父子 、祖先 - 后代以及兄弟关系 。由于采用素数和序列编码 ,可有效支持 XML 文档更新 ,降低 XML 文档的二次编码率 。实验表明 PSB 是一种高效的动态编码方法 。 关键词 :编码方案 素数和序列 XM L 更新 A New Eff ic ien t Num ber in g Schem e for XM L Tree s W E I Dong p ing, ZON G D e jun, SUN H uaguo ( In stitu te of Comp u te r and Comm un ica tion Enginee ring, The U n ive rsity of Pe tro leum ( Ea st Ch ina) , DongYing, 257061 , Ch ina) A b stra c t: B a sed on the comp a rison of the cu rren t XML cod ing m e thod, PSB - - a new cod ing m e thod wa s p ropo sed, wh ich can rap id ly and accu ra te ly judge the p a ren t - ch ild ance sto r / de scendan t and sib ling re la tion sh ip s be tween any two node s of the XML docum en t tree1 B a sed on p rim e and sequence num be r, th is cod ing m e thod wa s adop ted to suppo rt the XML up da te, wh ich can effec tive ly reduce the seconda ry XML cod ing ra te1 O u r exp e rim en ts show tha t PSB is a effec tive and dynam ic cod ing m e thod1 Keyword s: Cod ing M e thod, P rim e and Sequence, XML Up da te 1 引言 目前常用的 XML 数据库编码方案主要有 :位向量编码 [ 1 ] 、区间编码 [ 2 ] 、前缀编码 [ 3 ]等。 位向量编码 :位向量编码能够有效地支持节点间祖先 - 后代关系判断 ,但缺点是无法判断兄弟关系、父 子关系。并且对于信息量较大的 XML 文档 ,编码所占用的空间也相当可观。 区间编码 :树 T中的每一个结点被赋予一个区间编码 [ begin, end ] ,并且满足 :一个结点的区间编码覆盖 其后代结点的区间编码 。基于区间编码的方案有 : ( 1 ) D ie tz编码 [ 4 ] ( 2 ) L i - Moon 编码 [ 5 ] ( 3 ) Zhang编码 [ 6 ] 。 虽然区间编码方案能够有效地支持包含关系计算、文档位置关系的计算 ,同时编码的长度一般较小 。但是 , 基于区间的编码方案一直无法完全实现编码的动态特性 ,当插入的新结点的数量超过预留空间后 ,重新编 码所引起的时间和空间开销相当大 。并且查询复杂路径时要产生大量的连接运算 ,节点间的兄弟位置关系 也无法很好的表示。 前缀编码 :要判断一个节点 u是另一个节点 v的祖先 ,只需要判断节点 u的编码 c ( u )是节点 v编码 c ( v)的前缀 。前缀编码虽然编码和查询较简单 ,但是当要插入一个新节点时 ,就不得不把插入该节点的所有 右兄弟和所有右兄弟的子孙节点全部重新编码 ,不适用于数据经常变化的应用 ; 特别是当 XML 的文档树的 深度比较大时 ,前缀编码的检索和存储代价相当高 。 本文于 2008 - 09 - 08 收到 , 2008 - 10 - 15 收到修改稿。 鉴于现有编码机制存在的缺陷 , 本文提出一种基于素数整除和序列关系的编码机制

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档