Lucene检数据库支持中文检索.docVIP

  • 2
  • 0
  • 约2.66万字
  • 约 11页
  • 2016-10-17 发布于贵州
  • 举报
Lucene检数据库支持中文检索

全文分两部分: 一:Lucene简介 ?? ?? Lucene版本:3.0.2 ???? 全文检索大体分两个部分:索引创建(Indexing)和搜索索引(Search) ???? 1. 索引过程: ??????? 1) 有一系列被索引文件(此处所指即数据库数据) ??????? 2) 被索引文件经过语法分析和语言处理形成一系列词(Term)。 ??????? 3) 经过索引创建形成词典和反向索引表。 ??????? 4) 通过索引存储将索引写入硬盘。 ??? 2. 搜索过程: ?????? a) 用户输入查询语句。 ?????? b) 对查询语句经过语法分析和语言分析得到一系列词(Term)。 ?????? c) 通过语法分析得到一个查询树。 ?????? d) 通过索引存储将索引读入到内存。 ?????? e) 利用查询树搜索索引,从而得到每个词(Term)的文档链表,对文档链表进行交,差,并得到结果文档。 ?????? f) 将搜索到的结果文档对查询的相关性进行排序。 ?????? g) 返回查询结果给用户。 ? ? ?? ? 索引过程如下: ?????? ? 创建一个IndexWriter用来写索引文件,它有几个参数,INDEX_DIR就是索引文件所存放的位置,Analyzer便是用来对文档进行词法分析和语言处理的。 ?????? ? 创建一个Document代表我们要索引的

文档评论(0)

1亿VIP精品文档

相关文档