信息检索论文-基于Lucene的实验报告.docVIP

  • 28
  • 0
  • 约 10页
  • 2017-06-06 发布于山东
  • 举报
基于Lucene的报告 信息检索系统介绍 信息检索系统是借助信息检索技术,如全文检索等手段帮助用户检索特定信息的工具。它可以正确地表示,存储和组织信息,同时还提供信息的访问。在这里,信息的概念是非常广泛的,它可以是一篇文章,一个文本,一个网页,一封电子邮件,一张照片,甚至是一个收集的虚拟信息。 检索的整个过程包括:文本数据库的构建、索引和检索。 信息检索的过程: 1 建立一个文本库 一个信息检索系统需要准备之前,搜索功能的开发。首先,必须建立一个文本数据库。该文本数据库用于存储用户可以检索的所有信息。在此基础上,确定了检索系统中的文本模型。文本模型是一种被系统识别的信息格式,具有冗余性低等特点。当然,在系统的运行过程中,文本数据库的信息可能会不断变化。 2建立索引 当您拥有文本模型时,您应该创建一个基于数据库中的文本的索引.。索引可以大大提高信息检索的速度。建立索引的方法有多种,这取决于信息检索系统的大小。大规模的信息检索系统(如百度,谷歌,如搜索引擎)被用来创建一个倒排索引。 3搜索 索引文本后,可以开始搜索它。搜索请求通常由用户提交,请求进行分析,检索结果返回索引中。 Lucene 随着系统信息的越来越多,怎么样从这些信息海洋中捞起自己想要的那一根针就变得非常重要了,全文检索是通常用于解决此类问题的方案,而Lucene则为实现全文检

文档评论(0)

1亿VIP精品文档

相关文档