动态后继树索引压缩技术研究
摘要
随着社会信息化的不断推进,如何对海量的信息进行有效地组织
和管理并进行快速地查找,是全文检索技术面临的一大挑战。全文检
索技术给海量文本信息的管理和查找带来了方便,但是也面临着存储
空间增加,查询效率降低的缺点。针对涉密文本的密文全文检索技术,
除了存在着时空效率较低的缺点,还存在着安全性等风险。索引是全
文检索技术的核心,对适合海量化,涉密信息的索引结构进行研究,
并对索引进行压缩是一项迫切的任务。
动态后继树(S仃eamline
Dynamic
近提出的一种新型索引结构,它具有索引创建速度快、查询效率高的
特点,并且支持索引的动态更新,但是针对海量及涉密信息,该索引
结构的空间效率较低。为实现海量数据存储空间压缩,本文对动态后
继树索引结构进行改进,得到一种新的索引结构:改进的动态后继树
S仃e锄line
(hnprovedDynamic
并给出其索引创建算法。ISDST索引结构具有与SDST索引结构相同
的创建效率。
针对ISDST索引结构,提出一种索引压缩策略——树叶信息表
压缩(Colnpress吨LeafInfomlat
原创力文档

文档评论(0)