农作物病虫害抽取与分文检索技术地地研究.pdf

农作物病虫害抽取与分文检索技术地地研究.pdf

的本体。将本体与信息抽取技术相结合,使得不同来源的信息以统一 视图呈现。本文采用双层文本分类算法对文本进行事件概念的划分, 根据最优分类判断各块所属的类别,从而实现事件抽取。 为了有效地管理和查询农作物病虫害信息中的长文本字段,本文 基于Lucene对抽取到农作物病虫害信息中的某些字段构建了全文索 引。针对Lucene中文分词能力较弱的问题,本文利用本体中定义的 概念和实例,添加适合农作物病虫害信息的中文分词器,以达到更好 的分词效果。 基于以上工作,本文实现了一个农作物病虫害信息抽取和检索系 统,有效地实现了中文网页上的农作物病虫害信息抽取和全文检索。 关键词:信息抽取,网页分块,领域本体,Lucene,倒排索引 ResearchonInformationExtractionandFullText Articles Retrievalof Diseases Crop ABSTRACT withthe increaseofthenetwork

文档评论(0)

1亿VIP精品文档

相关文档