- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一个例子学懂搜索引擎(lucene)
一个例子学懂搜索引擎(lucene)
来源:javaeye 作者: phz50
其实,lucene是一个很容易上手的搜索引擎框架,传统的搜索引擎,涉及到爬虫,也就是爬取网页,然后对网页进行加工,也就是索引,最后用于搜索,lucene这个框架可以很方便的帮你做到后面两个步骤,也就是索引和搜索!本文尝试通过一个例子,使大家掌握lucene的使用核心方法,包括分词、索引、搜索不同的目录、搜索不同的域,希望大家通过这个实例,对lucene和搜索引擎能有比较全面的认识!
其实,lucene是一个很容易上手的搜索引擎框架,传统的搜索引擎,涉及到爬虫,也就是爬取网页,然后对网页进行加工,也就是索引,最后用于搜 索,lucene这个框架可以很方便的帮你做到后面两个步骤,也就是索引和搜索!本文尝试通过一个例子,使大家掌握lucene的使用核心方法,包括分 词、索引、搜索不同的目录、搜索不同的域,希望大家通过这个实例,对lucene和搜索引擎能有比较全面的认识!
下面是这个例子的代码:?phz.LuceneTest.java
package phz;?import org.apache.lucene.analysis.standard.StandardAnalyzer;?import org.apache.lucene.document.Document;?import org.apache.lucene.document.Field;?import org.apache.lucene.index.IndexWriter;?import org.apache.lucene.queryParser.MultiFieldQueryParser;?import org.apache.lucene.search.BooleanClause;?import org.apache.lucene.search.Hits;?import org.apache.lucene.search.IndexSearcher;?import org.apache.lucene.search.MultiSearcher;?import org.apache.lucene.search.Query;?/**?* 这个实例包含了lucene所有核心用法?*?* @author panhuizi?*?*/?public class LuceneTest {???? public static void main(String[] args) {???????? try {???????????? LuceneTest luceneTest = new LuceneTest();???????????? // 创建索引???????????? luceneTest.index();???????????? // 在索引所在目录下搜索中国 金牌???????????? luceneTest.search(中国 金牌);???????? } catch (Exception e) {???????????? e.printStackTrace();???????? }???????? System.out.println(ok);???? }???? public void index() throws Exception {???????? /* 创建索引初始化,执行这些语句将创建或清空d:\\save\\目录下所有索引 */???????? IndexWriter writer1 = new IndexWriter(d:\\save\\,???????????????? new StandardAnalyzer(), true);???????? writer1.close();???????? /*????????? * 往创建的初始化索引中添加索引内容,StandardAnalyzer表示用lucene自带的标准分词机制,????????? * false表示不覆盖原来该目录的索引,细心的读者可能已经发现, 这句话和上面的那句就这个false不一样????????? */???????? IndexWriter writer2 = new IndexWriter(d:\\save\\,???????????????? new StandardAnalyzer(), false);???????? /* 创建一份文件 */???????? Document doc1 = new Document();???????? /*????????? * 创建一个域ArticleTit
您可能关注的文档
- 【日出书屋·自主原创编制】七年级下册教案4.3探索三角形全等条件(三).doc
- 【数学】2.1.2《空间的平行直线与异面直线》课件(新人教A版必修2).ppt
- 【斯芬克英国留学规划】英国留学规划三步曲 艺术留学申请必看.doc
- 【数据机构(C语言描述)】第七章 图.ppt
- 【数学】1.2.2 基本初等函数的导数公式及导数的运算法则 课件(人教A版选修2-2).ppt
- 【杨小天编】05-整式的乘除与因式分解综合复习测试2及答案.pdf
- 【步步高】2014高考数学二轮专题突破(文科)专题一 第3讲.ppt
- 【电动力学课件】2-1-2 标势及其方程-唯一性定理.pdf
- 【疾病名】过敏性支气管肺曲霉病【英文名】allergic bro.pdf
- 【精华版】第7章__一元一次不等式与不等式组_讲义+习题 2.doc
最近下载
- 社会组织会费票据管理制度(范本).pdf VIP
- 代理记账业务内部管理规范制度范本.docx(核实添加无关内容) VIP
- 《公路沥青路面施工技术规范》(F40-2004 )【可编辑】.docx VIP
- 光的人眼非视觉生物效应作用剂量 编制说明.pdf
- 多准:天猫啤酒2022年趋势报告.pdf VIP
- 2025年高考政治复习知识清单必修一《中国特色社会主义》【答题模板】.pdf VIP
- 苏S01-2012给水排水图集(无水印).docx VIP
- 制瓶机供料机.doc VIP
- 加油站防汛应急预案.docx VIP
- 泌尿外科利用PDCA循环降低持续膀胱冲洗患者膀胱痉挛的发生率品管圈.pptx VIP
文档评论(0)