一种全新的全文索引模型——后继数组模型.PDFVIP

  • 6
  • 0
  • 约1.9万字
  • 约 9页
  • 2017-10-14 发布于天津
  • 举报

一种全新的全文索引模型——后继数组模型.PDF

一种全新的全文索引模型——后继数组模型.PDF

1000-9825/2002/13(01)0150-09 ©2002 Journal of Software 软 件 学 报 Vol.13, No.1 一种全新的全文索引模型——后继数组模型 刘学文, 陶晓鹏, 于 玉, 胡运发 (复旦大学,上海 200433) E-mail: liuxuewen2001@ 摘要: 提出了一种新的全文索引模型——后继数组模型, 它结合了目前多个主流全文检索模型(倒排表模型、Pat 数组模型等) 的优点,提高了空间效率和时间效率,并得到了理论和实验的证明. 关 键 词: 全文索引;倒排表;Pat 数组;后继数组 中图法分类号: TP311 文献标识码: A 全文检索是文本数据库(它被定义为管理大量文本的系统)研究的核心.而全文检索的首要问题是全文索引 模型的选择. 目前主流的全文索引模型有倒排表模型和 Pat 数组模型[1]等,但它们都有自身的缺点.本文针对它 们的不足,提出了一种全新的全文索引模型,称为后继数组模型.这种模型能有效地改进已有模型的不足,并且 还可以作为文本挖掘的基础数据模型(统计型索引),而不仅仅是全文检索的模型(检索型索引).我们认为,这种 模型才是真正符合未来全文数据库需要的. 1 全文索引模

文档评论(0)

1亿VIP精品文档

相关文档