Nutch1.0开源搜索引擎与Paoding在eclipse中用plugin方式集成(终极篇).docVIP

  • 3
  • 0
  • 约6.94千字
  • 约 10页
  • 2017-08-12 发布于河南
  • 举报

Nutch1.0开源搜索引擎与Paoding在eclipse中用plugin方式集成(终极篇).doc

Nutch1.0开源搜索引擎与Paoding在eclipse中用plugin方式集成(终极篇) 文章分类:互联网 ???? 本文主要描述的是如何将paoding分词用plugin方式集成到 nutch1.0中去,在集成之前首先要在eclipse中把nutch1.0编译通过。然后,写一个中文分词程序,配置好插件配置文件,重新打包编译。 如果有linux环境,就可以直接进行编译,如果没有linux环境,还需要下载并配置cygwin等模拟linux环境。配置paoding插件 1)写中文分词程序,继承NutchAnalyzer /** * Paoding chinese analyzer */ package org.apache.nutch.analysis.zh; // JDK imports import java.io.Reader; // Lucene imports import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.TokenStream; // Nutch imports import org.apache.nutch.analysis.NutchAnalyzer; /** * A simple Chinese Analyzer that w

文档评论(0)

1亿VIP精品文档

相关文档