Lucene全文搜索框架详解与实践.pdfVIP

  • 0
  • 0
  • 约4.01千字
  • 约 9页
  • 2026-01-23 发布于北京
  • 举报

•Lucene简介

1.什么是lucene

Lucene是一个全文搜索框架,而不是应用产品。因此它并不像或者

Desktop那么拿来就能用,它只是了一种工具让你能实现这

些产品。

•2.lucene能做什么

•要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,

说到底,就是你给它若干个字符串,然后它为你一个全文搜索服务,

告诉你你要搜索的出现在哪里。知道了这个本质,你就可以发挥想

象做任何符合这个条件的事情了。你可以把站内都索引了,做个资料

库;你可以把一个数据库表的若干个字段索引起来,那就不用再担心因为

“%like%”而锁表了;你也可以写个自己的搜索引擎……

•3.你该不该选择lucene

•下面给出一些测试数据,如果你觉得可以接受,那么可以选择。

–测试一:250万记录,300M左右文本,生成索引380M左右,800线程下平均处理时间

300ms。

–测试二:37000记录,索引数据库中的两个varchar字段,索引文件2.6M,800线程下平

均处理时间1.5ms。

•4.lucene为什么这么快

–倒排索引

–压缩算法

–二元搜索

•5.倒排索引

–根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属

文档评论(0)

1亿VIP精品文档

相关文档