Lucene 3.2学习总结.ppt

下载文档 降价啦

0
0
约 31页
2015-08-22 发布于广东
举报
版权申诉
保障服务

Lucene 3.2学习总结.ppt

1、本文档共31页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

Lucene 3.2学习总结 by willzhai Agenda Lucene 是什么？ Lucene 在酷米客的使用和遇到的问题 Lucene 高级功能分析讨论 Lucene 是什么？ Apache Lucene(TM) is a high-performance, full-featured text search engine library written entirely in Java. It is a technology suitable for nearly any application that requires full-text search, especially cross-platform. Full-text Search 倒排索引创建和搜索相关Class Directory IndexWriterConfig IndexWriter Analyzer Document Field IndexReader IndexSearcher TopDocs Directory 索引文件存放的位置抽象类，四种实现： FileSwitchDirectory FSDirectory NRTCachingDirectory RAMDirectory IndexWriterConfig IndexWriter的配置类构造函数 IndexWriterConfig(Version?matchVersion, Analyzer?analyzer) Analyzer 从文本中抽取索引项，构造TokenStreams 中文分词庖丁解牛中科院分词库 SmartChineseAnalyzer 例子：查询词：“儿童手机” 分词之后：“儿童”、“手机” IndexWriter 创建和维护搜索类添加新的Document到索引文件中对索引文件只写 Document Field的集合索引文件的基本单元，类似数据库的行 Fields的元数据分别索引和存储仅持有java.lang.String和java.io.Reader Field Document 对象的组成部分 K-V形式类似数据库的列概念 IndexReader 访问索引文件抽象类，只读具体实现类： FilterIndexReader InstantiatedIndexReader MultiReader ParallelReader SegmentReader IndexSearcher 索引搜索类主要方法search TopDocs hits = searcher.search(boolQuery, num, sort); 创建索引流程图创建索引API 指定索引文件存放的目录（Directory）选择合适的分词器（Analyzer ）生成索引生成器的配置（IndexWriterConfig）生成索引生成器（IndexWriter）生成多个索引文档（ Document ），类似数据库的行；一个索引文档包括若干索引域（ Field ），类似数据库的列添加索引文档（ Document ）到索引生成器（ IndexWriter ）索引生成器优化（optimize）和关闭（close）代码示例 File indexDirFile=new File(indexDirPath); Directory indexD = FSDirectory.open(indexDirFile); Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_32); IndexWriterConfig conf = new IndexWriterConfig(Version.LUCENE_32, analyzer); IndexWriter writer = new IndexWriter(indexD, conf); Document doc = new Document(); File f=new File(fileToIndexPath); doc.add(new Field(path, f.getCanonicalPath(), Field.Store.YES, Field.Index.NOT_ANALYZED)); doc.add(new Field(“content, new FileReader(f), Field.TermVector.WITH_POSITIONS)); writer.addDocument(doc); writer.optimize(); writer.close(); 索引文件 Lucene如何搜索用户输入查询语句。对查询语句进行词法分析，语法分析