lucene索简单介绍__索引介绍.pptVIP

  • 3
  • 0
  • 约2.72千字
  • 约 16页
  • 2016-10-11 发布于贵州
  • 举报
Lucene:基于Java的全文检索引擎简介 赵力 Lucene和数据库 Lucene的API接口设计的比较通用,输入输出结构都很像数据库的表==记录==字段,所以很多传统的应用的文件、数据库等都可以比较方便的映射到Lucene的存储结构/接口中。总体上看:可以先把Lucene当成一个支持全文索引的数据库系统。 Lucene和数据库 Lucene中最基本的概念有:index, document, term. Index包含一个document序列(document的有序集合)。 1 一个document是一个field序列(field的有序集合) 2 一个field是一个term的命名序列。 3??一个term是一个字符串。 ????在两个不同field中的同一个字符串被认为是不同的term。因此terms是用一个字符串对来表示,第一个字符串的名字是field,第二个字符串的名字是text. Lucene和数据库 全文检索 通常比较厚的书籍后面常常附关键词索引表(比如:北京:12, 34页,上海:3,77页……),它能够帮助读者比较快地找到相关内容的页码。而数据库索引能够大大提高查询的速度原理也是一样,想像一下通过书后面的索引查找的速度要比一页一页地翻内容高多少倍……而索引之所以效率高,另外一个原因是它是排好序的。对于检索系统来说核心是一个排序问题。 全

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档