- 6
- 0
- 约1.9万字
- 约 9页
- 2017-10-14 发布于天津
- 举报
一种全新的全文索引模型——后继数组模型.PDF
1000-9825/2002/13(01)0150-09 ©2002 Journal of Software 软 件 学 报 Vol.13, No.1
一种全新的全文索引模型——后继数组模型
刘学文, 陶晓鹏, 于 玉, 胡运发
(复旦大学,上海 200433)
E-mail: liuxuewen2001@
摘要: 提出了一种新的全文索引模型——后继数组模型, 它结合了目前多个主流全文检索模型(倒排表模型、Pat
数组模型等) 的优点,提高了空间效率和时间效率,并得到了理论和实验的证明.
关 键 词: 全文索引;倒排表;Pat 数组;后继数组
中图法分类号: TP311 文献标识码: A
全文检索是文本数据库(它被定义为管理大量文本的系统)研究的核心.而全文检索的首要问题是全文索引
模型的选择. 目前主流的全文索引模型有倒排表模型和 Pat 数组模型[1]等,但它们都有自身的缺点.本文针对它
们的不足,提出了一种全新的全文索引模型,称为后继数组模型.这种模型能有效地改进已有模型的不足,并且
还可以作为文本挖掘的基础数据模型(统计型索引),而不仅仅是全文检索的模型(检索型索引).我们认为,这种
模型才是真正符合未来全文数据库需要的.
1 全文索引模
您可能关注的文档
- PLC与交流变频器通讯的实现.PDF
- T形脊柱复位固定系统(SRFS)固定胸腰椎骨折脱位的生物力学研究.PDF
- 《纺织行业十二五技术标准体系建设方案——纺织行业卷》概述.PDF
- 一位慢性骨髓炎病患之护理经验.PDF
- 一位脊髓损伤并顽固性压疮行结肠造口患者之护理经验.PDF
- 一株鸭源H5N1亚型禽流感病毒人工感染鸡的病理学研究.PDF
- 一种基于激光测距波纹板机器人自动焊接轨迹恢复方法.PDF
- 一种多说话人角色聚类方法.PDF
- 一种移动犃犱犎狅犮网络可生存性模型建模及仿真验证方法.PDF
- 一种翻转课堂的螺旋模型及实现.PDF
- 计算机二级MS Excel2026年高频考点含解析.docx
- 计算机二级MS Office2026年冲刺卷含解析.docx
- 计算机二级MS Office高级应用2026年冲刺全真模拟含解析.docx
- 计算机二级MS Office高级应用2026年押题高频考点含解析.docx
- 2026年新高考全国卷一数学导数易错题预测卷含解析.docx
- 2026年新高考全国卷语文压轴题模拟卷含解析.docx
- 2026年新高考全国乙卷高考数学易错题卷(含解析).docx
- 2026年新高考生物稳态调节专题预测分析卷(含解析).docx
- 2026年新课标 I 卷高考化学易错点专项模拟卷含解析.docx
- 2026年新课标 I 卷高考生物押题模拟卷含解析.docx
原创力文档

文档评论(0)