IKAnalyzer中文分词器V315使用手册.pdfVIP

  • 5
  • 0
  • 约1.11万字
  • 约 14页
  • 2020-12-04 发布于河南
  • 举报
IKAnalyzer中文分词器 V3.X使用手册 目录 1.IK Analyzer 3.0介绍2 2.使用指南4 3.词表扩展11 4针对 solr的分词器应用扩展13 5.关于作者14 1.IKAnalyzer3.0介绍 IK Analyzer 是一个开源的,基于java 语言开发的轻量级的中文分词工具包。从2006 年 12 月推出 1.0 版开始, IKAnalyzer 已经推出了 3 个大版本。最初,它是以开源项目 Luence 为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的 IK Analyzer 3.0 则发展为面向 Java 的公用分词组件,独立于 Lucene 项目,同时提供了对 Lucene 的默认优化实现。 1.1 IK Analyzer 3.0 结构设计 1.2 IK Analyzer 3.0 特性 � 采用了特有的“正向迭代最细粒度切分算法“,具有60万字/秒的高速处理能力。 � 采用了多子处理器分析模式,支持:英文字母(IP地址、Email

文档评论(0)

1亿VIP精品文档

相关文档