支持XML数据更新的编码方案和索引技术研究.pdf

支持XML数据更新的编码方案和索引技术研究.pdf

摘 要 XML已经成为Internet上数据表示和数据交换的标准格式。近 年来,在Web上涌现了大量的XML数据。为了更容易的操作XML 文档中的数据,专家和学者们在编码、索引、查询等方面做了积极 深入的研究,已经提出了大量的编码方案和索引技术,但当XML 数据需要频繁的更新时,由于这些编码方案和索引技术都不支持 XML数据的动态更新,需花很大的代价去重新编码和建立索引,严 重影响了它们的效率。为此,本文在支持XML数据动态更新的编码 方案和索引技术方面进行了有益的探索。 本文深入分析了XML文档的结点编码技术,提出了一种支持 XML数据动态更新的结点编码方案CSSU。CSSU编码采用字母、 数字和下划线对结点进行编码,改变了传统编码方案主要采用数字 序号进行编号的特点。由于插入和删除结点,不影响其他结点的编 码,完全不需要重新编码。CSSU编码在任意两编码之间存在无穷大 的编码空间,不会出现LI.MOON编码那样通过预留编码空间的方 式存在编码空间会用完和预留空间大小不容易确定的问题。所以当 XML数据需要频繁的更新时,可以成倍地提高结点编码的效率。 以CSSU编码为基础,本文提出了一种新的支持XML数据动态 更新的索引DUIX。DUIX索引可以快速确定任意两结点间的结构关 系,同时保存了孩子一双亲元素的详细信息,并把相同标签路径的结 点聚簇在一起。DUIX索引支持分支查询,不再依赖XML文档,访 问一条路径可得到该标签路径下的所有结点,跳过了大量不相关的 结点。与其他索引技术相比DUIX索引的效率更高。 索引是有效的。 关键词:路径摘要,编码方案,索引 ABSTRACT to and XMLhasbecomeanewstandardformat exchange express dataintheInternet.Inrecent numberofXMLdatahas large years,a orderto thedataintheXML process document,expert emergenced.In andresearcherhavedone and on positivedepthstudyencoding, andSO numberof schemesand on,a indexing,queryinglarge coding havebeen tore-codeand indexingtechniques proposed.It’Sexpensive the re—indexwhentheXMLdata affected updatedfrequently’which these schemesandindexing efficiencyseriously.Becausecoding couldn’t XMLdata.Inthis techniques supportdynamicalupdating

文档评论(0)

1亿VIP精品文档

相关文档