Lucene实现全文检索.pptVIP

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Lucene实现全文检索

* 注意事项 大吞吐量操作,内存溢出问题: java.lang.OutOfMemoryError: Java heap space * 总结 全文检索——一种最具实用性和通用性的信息检索方式 Lucene——一种全文检索框架 Lucene检索步骤——收集数据、创建索引、信息检索 * Thank you * 1-同学们好,今天的讲座题目是Java I/O操作。 2-I/O操作对于任何程序开发语言来说都必不可少的基本功能,对于Java语言更是如此。 3-它不是一种新技术,但却是实际工作中所使用最为频繁且最能解决现实问题的方法和手段。 4-今天,我们将从Java的视角来探究一下I/O操作的细节问题。 * 1-今天的讲座内容包括……(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) * 1-首先先明确一下什么是I/O操作。(参考PPT) 技术讲座之 Lucene 实现全文检索 * 全文检索介绍 索引 分词 Lucene介绍 Lucene应用详解 索引器 检索器 条件查询 实用工具及高亮器 Lucene综合应用——仿 搜索引擎 内容要点 * 什么是全文检索 全文检索——是一种最具实用性和通用性的信息检索方式,它将用户的查询请求和全文中的每一个词进行比较,不考虑查询请求与文本语义上的匹配。 全文检索的应用领域那是相当的多噢! * 全文检索≠like 数据库提供了like关键字让我们可以对信息进行模糊查询,但这样的查询结果并不准确。 主要问题: 1.结果不准确 例如:like ‘%luce%’ = lucene 2.没有相关度排序 3.效率低 * 全文检索的过程 第一步:提取数据。 任何可提取出文本信息的资源都可作为搜索目标。(如:本地文件系统、网页信息等) * 全文检索的过程 第二步:为数据创建索引。 搜索的目的是为了在大量的信息中发现自己感兴趣的信息。但是在浩渺的信息库中东寻西找,无异于大海捞针。如何才能更方便快捷的定位所需信息呢? 对信息创建索引,能更快找到我想要的 * 全文检索的过程 第三步:分析检索条件,检索索引库,由索引找到所需信息资源。 * Lucene介绍 Lucene是一个高性能、可伸缩的信息搜索(IR)库。它使你可以为你的应用程序添加索引和搜索能力。Lucene是用java实现的成熟的、免费的开源项目,是著名的Apache Jakarta大家庭的一员,并且基于在Apache软件许可 [ASF, License]。同样,Lucene是当前与近几年内非常流行的免费的Java信息搜索(IR)库。 Doug Cutting 著名的全文搜索引擎 Lucene 和 Nutch及Hadoop的创始人。 曾任雅虎架构师 现就职于CLOUDERA(优秀云计算服务提供商) * Lucene应用详解 索引相关对象

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档