lucen的应用.ppt

课程内容 第一章: lucene简介 第二章:入门实例 第三章:内建Query对象 第四章:分析器Analyzer 第五章: Query Parser 第六章:索引 第七章:排序 第八章:过滤 项目实践:构建一个简单的WEB搜索程序 第一章:Lucene简介 搜索引擎的历史 什么是Lucene 全文检索系统的结构 为什么使用Lucene Lucene倒排索引原理 Lucene Implementations 基于Lucene的搜索程序 Compass Nutch 开源搜索引擎列表 全球商用搜索市场 Heritrix介绍 课堂练习:Heritrix简单抓取任务的设置 搜索引擎的历史 萌芽:Archie、Gopher  起步:Robot(网络机器人)的出现与Spider(网络爬虫)  发展:Excite、Galaxy、Yahoo等 繁荣:Infoseek、AltaVista、Google和Baidu  什么是Lucene Lucene是非常优秀的成熟的开源的免费的纯java语言的全文索引检索工具包。 全文检索?是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。 Lucene是一个高性能、可伸缩的信息搜索(IR)库。 Informatio

文档评论(0)

1亿VIP精品文档

相关文档