半结构化数据相似搜索的索引技术研究.PDFVIP

  • 5
  • 0
  • 约8.97万字
  • 约 8页
  • 2018-01-06 发布于天津
  • 举报

半结构化数据相似搜索的索引技术研究.PDF

第卷第期计算机学报年月半结构化数据相似搜索的索引技术研究杨建武陈晓鸥北京大学计算机研究所文字信息处理技术国家重点实验室北京摘要为了在海量高维动态的半结构化数据集上进行有效的相似搜索该文提出一种采用聚类技术进行索引一一一构建与更新的多路平衡树一树以及基于树的相似搜索与动态更新的算法树借鉴树基于聚组思了坐织类进行节点织与分裂的基本想避免根据标维进行分裂时所要求的维不相关性同时在节点组分裂算法和搜索算法等方面进行了改进提出了新的搜索剪枝策略实验表明该结构及算法对海量半结构化数据相似搜索的效率明显优于传

第 卷 第 期 计 算 机 学 报 年

文档评论(0)

1亿VIP精品文档

相关文档