- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种新的高效XML树编码方案
微 计 算 机 应 用
M ICROCOM PU TER A PPL ICA T ION S
第 29卷第 12期
2008年 12月
Vo l129 No112
D ec12008
一种新的高效 XML 树编码方案
魏东平
宗德君
孙华国
(中国石油大学 (华东 ) 计算机与通信工程学院 计算机科学技术系 东营 257061 )
摘要 :在深入分析现有 XML 编码方案基础上 ,提出了一种新的编码方案 —PSB ,该方案能够快速准确地判断出 XML 文档结构
树中任意两个结点之间的父子 、祖先 - 后代以及兄弟关系 。由于采用素数和序列编码 ,可有效支持 XML 文档更新 ,降低 XML
文档的二次编码率 。实验表明 PSB 是一种高效的动态编码方法 。
关键词 :编码方案 素数和序列 XM L 更新
A New Eff ic ien t Num ber in g Schem e for XM L Tree s
W E I Dong p ing, ZON G D e jun, SUN H uaguo
( In stitu te of Comp u te r and Comm un ica tion Enginee ring, The U n ive rsity of Pe tro leum ( Ea st Ch ina) ,
DongYing, 257061 , Ch ina)
A b stra c t: B a sed on the comp a rison of the cu rren t XML cod ing m e thod, PSB - - a new cod ing m e thod wa s p ropo sed, wh ich can rap id ly
and accu ra te ly judge the p a ren t - ch ild ance sto r / de scendan t and sib ling re la tion sh ip s be tween any two node s of the XML docum en t tree1 B a sed on p rim e and sequence num be r, th is cod ing m e thod wa s adop ted to suppo rt the XML up da te, wh ich can effec tive ly reduce the seconda ry XML cod ing ra te1 O u r exp e rim en ts show tha t PSB is a effec tive and dynam ic cod ing m e thod1
Keyword s: Cod ing M e thod, P rim e and Sequence, XML Up da te
1 引言
目前常用的 XML 数据库编码方案主要有 :位向量编码 [ 1 ] 、区间编码 [ 2 ] 、前缀编码 [ 3 ]等。
位向量编码 :位向量编码能够有效地支持节点间祖先 - 后代关系判断 ,但缺点是无法判断兄弟关系、父 子关系。并且对于信息量较大的 XML 文档 ,编码所占用的空间也相当可观。
区间编码 :树 T中的每一个结点被赋予一个区间编码 [ begin, end ] ,并且满足 :一个结点的区间编码覆盖
其后代结点的区间编码 。基于区间编码的方案有 : ( 1 ) D ie tz编码 [ 4 ] ( 2 ) L i - Moon 编码 [ 5 ] ( 3 ) Zhang编码 [ 6 ] 。
虽然区间编码方案能够有效地支持包含关系计算、文档位置关系的计算 ,同时编码的长度一般较小 。但是 ,
基于区间的编码方案一直无法完全实现编码的动态特性 ,当插入的新结点的数量超过预留空间后 ,重新编 码所引起的时间和空间开销相当大 。并且查询复杂路径时要产生大量的连接运算 ,节点间的兄弟位置关系 也无法很好的表示。
前缀编码 :要判断一个节点 u是另一个节点 v的祖先 ,只需要判断节点 u的编码 c ( u )是节点 v编码 c ( v)的前缀 。前缀编码虽然编码和查询较简单 ,但是当要插入一个新节点时 ,就不得不把插入该节点的所有 右兄弟和所有右兄弟的子孙节点全部重新编码 ,不适用于数据经常变化的应用 ; 特别是当 XML 的文档树的 深度比较大时 ,前缀编码的检索和存储代价相当高 。
本文于 2008 - 09 - 08 收到 , 2008 - 10 - 15 收到修改稿。
鉴于现有编码机制存在的缺陷 , 本文提出一种基于素数整除和序列关系的编码机制
您可能关注的文档
- 《箭牌瓷砖 卫浴之大客户销售技巧》.ppt
- 《老师呀请你别生气》音乐课件_图文.ppt
- 《自己改造自己——自我意象与人格改造》.doc
- 《绿色植物的作用》复习课件.ppt
- 《翻过来一想》课件.ppt
- 《自然保护区》教案设计.doc
- 《草原监理学》教学大纲.doc
- 《绿色上网,健康成长》课件.ppt
- 《褚橙你也学不会》读书笔记_模板_实用文档.ppt
- 《论贾探春形象》 论文.doc
- 苏教版8年级上册数学全册教学课件(2021年10月修订).pptx
- 比师大版数学4年级下册全册教学课件.pptx
- 冀教版5年级上册数学全册教学课件.pptx
- 办公室普通党员2024年组织生活会个人对照检查发言材料供参考.docx
- 领导班子成员2025年组织生活会“四个带头”对照检查材料范文.docx
- 2024年度专题组织生活会个人“四个带头”对照检查材料范文.docx
- 党支部领导班子2025年民主生活会“四个带头”个人对照检查材料范文.docx
- 2024年抓基层党建工作述职报告参考范文.docx
- 2024年度民主生活会征求意见情况的报告范文2篇.docx
- 普通党员2024年组织生活会个人“四个带头”对照检查发言材料2篇.docx
文档评论(0)