网站大量收购独家精品文档,联系QQ:2885784924

Lucene 3.2学习总结.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Lucene 3.2学习总结 by willzhai Agenda Lucene 是什么? Lucene 在酷米客的使用和遇到的问题 Lucene 高级功能分析 讨论 Lucene 是什么? Apache Lucene(TM) is a high-performance, full-featured text search engine library written entirely in Java. It is a technology suitable for nearly any application that requires full-text search, especially cross-platform. Full-text Search 倒排索引 创建和搜索相关Class Directory IndexWriterConfig IndexWriter Analyzer Document Field IndexReader IndexSearcher TopDocs Directory 索引文件存放的位置 抽象类,四种实现: FileSwitchDirectory FSDirectory NRTCachingDirectory RAMDirectory IndexWriterConfig IndexWriter的配置类 构造函数 IndexWriterConfig(Version?matchVersion, Analyzer?analyzer) Analyzer 从文本中抽取索引项,构造TokenStreams 中文分词 庖丁解牛 中科院分词库 SmartChineseAnalyzer 例子: 查询词:“儿童手机” 分词之后:“儿童”、“手机” IndexWriter 创建和维护搜索类 添加新的Document到索引文件中 对索引文件只写 Document Field的集合 索引文件的基本单元,类似数据库的行 Fields的元数据分别索引和存储 仅持有java.lang.String和java.io.Reader Field Document 对象的组成部分 K-V形式 类似数据库的列概念 IndexReader 访问索引文件抽象类,只读 具体实现类: FilterIndexReader InstantiatedIndexReader MultiReader ParallelReader SegmentReader IndexSearcher 索引搜索类 主要方法search TopDocs hits = searcher.search(boolQuery, num, sort); 创建索引流程图 创建索引API 指定索引文件存放的目录(Directory) 选择合适的分词器(Analyzer ) 生成索引生成器的配置(IndexWriterConfig) 生成索引生成器(IndexWriter) 生成多个索引文档( Document ),类似数据库的行;一个索引文档包括若干索引域( Field ),类似数据库的列 添加索引文档( Document )到索引生成器( IndexWriter ) 索引生成器优化(optimize)和关闭(close) 代码示例 File indexDirFile=new File(indexDirPath); Directory indexD = FSDirectory.open(indexDirFile); Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_32); IndexWriterConfig conf = new IndexWriterConfig(Version.LUCENE_32, analyzer); IndexWriter writer = new IndexWriter(indexD, conf); Document doc = new Document(); File f=new File(fileToIndexPath); doc.add(new Field(path, f.getCanonicalPath(), Field.Store.YES, Field.Index.NOT_ANALYZED)); doc.add(new Field(“content, new FileReader(f), Field.TermVector.WITH_POSITIONS)); writer.addDocument(doc); writer.optimize(); writer.close(); 索引文件 Lucene如何搜索 用户输入查询语句。 对查询语句进行词法分析,语法分析

文档评论(0)

ajgoaw + 关注
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档