- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用lucene实现在一个(或者多个)字段中查找多个关键字
用lucene实现在一个 或者多个 字段中查找多个关键字
最近跟着师兄们做个项目,我的任务就是负责做个“全文检索”的小模块。用到了Lucene的索引,下面的是其中的用Lucene实现在索引的一个字段 比如文章内容字段 进行查找多个关键字的实例代码。
1.Lucene说明
Lucene是非常优秀的成熟的开源的免费的纯java语言的全文索引检索工具包。
Lucene的的强项在“建立索引”和”搜索“,而不是实现具体的”分词“。Lucene支持对生成索引的进行”增,删,改,查“操作,这比自己建立的索引有了很大的进步。
可以使用专门的分词程序进行分词,在分词的结果上用Lucene建立索引。
2.用Lucene实现在一个或者多个字段中的检索
主要是函数:MultiFieldQueryParser.parse String[] query,String[] field,Occur[] occ,Analyzer analyzer ; 1 query:要查找的字符串数组 2 field:要查找的字符串数组对应的字段(当然有可以相同的) 3 occ:表示对应字段的限制。有三种:Occur.MUST 必须有 , Occur.MUST_NOT 必须没有 ,Occur.SHOULD 应该 4 analyzer:对查询数据的分析器,最好与建立索引时用的分析器一致
3.代码示例
下面这个程序可以实现在一个字段“contents”中查找多个关键字。稍加修改也可以在多个字段查找多个关键字。
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.queryParser.MultiFieldQueryParser;
import org.apache.lucene.search.BooleanClause.Occur;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
public class MultiPhraseQuerySearcher private static String indexPath E:\\Lucene\\index; // 索引保存目录 public static void createIndex // 建立索引 IndexWriter writer; try writer new IndexWriter indexPath,new StandardAnalyzer ,true ; Field fieldB1 new Field contents,今晚的辩题很道地:在我们这些人当中?,Field.Store.YES,Field.Index.TOKENIZED ; Field fieldB2 new Field contents,我们为电影《今朝》是一部不错的影片。,Field.Store.YES,Field.Index.TOKENIZED ; Field fieldB3 new Field contents,我们到底是啥意思呢?,Field.Store.YES,Field.Index.TOKENIZED ; Document doc1 new Document ; Document doc2 new Document ; Document doc3 new Document ; doc1.add fieldB1 ; doc2.add fieldB2 ; doc3.add fieldB3 ; writer.addDocument doc1 ; writer.addDocument doc2 ; writer.addDocument doc3 ; writer.close ; catch Exception e e.printStackTrace ; public static void main String[] args //contests字段上查找含有我们,今晚这两个字段的Doument Query query; IndexSearcher searcher; try //生成索引 c
您可能关注的文档
- 生长激素普及知识.doc
- 生鲜专柜租赁合同.doc
- 生鲜电商我厨三大竞争优势.doc
- 用1克拉钻戒演绎别样人生精彩.docx
- 用3DMAX软件制作海面漂浮文字效果.doc
- 用3dsMax制作逼真彩色玻璃效果.doc
- 用494作自制车载电源直流变换器.doc
- 用3D方法实现2D斜视角地图.doc
- 用3分钟学会PS实用工具让你的宝贝更漂亮.doc
- 用87C196NT单片机实现CAN总线通信.doc
- 护理学相关知识复习测试卷共三套.doc
- 护理学相关知识复习试题含答案(3套).doc
- 2025届高考语文复习:补写句子 课件.pptx
- 气压带和风带对气候的影响(第1课时)(教学设计).docx
- 气压带和风带对气候影响教学设计2024-2025学年高中地理人教版(2019)选择性必修1.docx
- 《故都的秋》课件 2024-2025学年统编版高中语文必修上册.pptx
- 《屈原列传》课件 2024-2025学年统编版高中语文选择性必修中册.pptx
- 《巫溪家乡文化》课件-2024-2025学年高一语文同步备课课件(统编版必修上册).pptx
- 《苏武传》课件 2023-2024学年统编版高中语文选择性必修中册.pptx
- 郑州中控ZKTime8.3 WEB考勤软件培训文档.pptx
最近下载
- 第20课 走进大自然(课件)-2024冀美版美术二年级上册.pptx
- 05系列建筑标准设计05N6图集.pptx
- Module 3(复习课件)五年级英语上册(外研版三起).pptx
- 中亚(48张ppt).ppt
- EPS7100工业以太网交换机安装说明书V1.01.pdf VIP
- 《中国工程企业海外合规经营与风险防范》微解.ppt
- 2024年国家开放大学《形势与政策》大作业:中华民族现代文明有哪些鲜明特质?建设中华民族现代文明的路径是什么?[附4份答案]供参考.docx
- 洒水车租赁协议书(标准版).docx VIP
- 3119005234赖宇轩《路由与交换技术》实训课实验报告2022 (2).docx VIP
- 基于决策树的可疑交易账户预警模型.pdf VIP
文档评论(0)