- 3
- 0
- 约6.94千字
- 约 10页
- 2017-08-12 发布于河南
- 举报
Nutch1.0开源搜索引擎与Paoding在eclipse中用plugin方式集成(终极篇)
文章分类:互联网
???? 本文主要描述的是如何将paoding分词用plugin方式集成到 nutch1.0中去,在集成之前首先要在eclipse中把nutch1.0编译通过。然后,写一个中文分词程序,配置好插件配置文件,重新打包编译。 如果有linux环境,就可以直接进行编译,如果没有linux环境,还需要下载并配置cygwin等模拟linux环境。配置paoding插件
1)写中文分词程序,继承NutchAnalyzer
/** * Paoding chinese analyzer */ package org.apache.nutch.analysis.zh; // JDK imports import java.io.Reader; // Lucene imports import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.TokenStream; // Nutch imports import org.apache.nutch.analysis.NutchAnalyzer; /** * A simple Chinese Analyzer that w
您可能关注的文档
最近下载
- (二模)2026年沈阳市高三年级教学质量监测(二)化学试卷(含答案).pdf
- 2025年黑龙江省纪委公务员遴选考试真题和答案.docx VIP
- 2025年口腔医学主治医师考试《专业知识》真题卷(含每题答案).docx VIP
- 全国医疗器械技术审评考试真题试卷(含答案).pdf VIP
- 2025河北水文四队地质勘查有限公司(第三批)招聘考试备考试题及答案解析.docx VIP
- 植物与植物生理 植物分类 植物分类基础.pptx VIP
- 巴音敖包嘎查废弃矿坑地质环境恢复治理项目环评报告书.pdf VIP
- 【TechInsights】2025存储技术趋势与展望报告聚焦DRAM和NAND技术.docx
- (三模)榆林市2026届高三年级四月检测训练政治试卷(含答案及解析).docx
- 等比数列导学学案.pptx VIP
原创力文档

文档评论(0)