的本体。将本体与信息抽取技术相结合,使得不同来源的信息以统一
视图呈现。本文采用双层文本分类算法对文本进行事件概念的划分,
根据最优分类判断各块所属的类别,从而实现事件抽取。
为了有效地管理和查询农作物病虫害信息中的长文本字段,本文
基于Lucene对抽取到农作物病虫害信息中的某些字段构建了全文索
引。针对Lucene中文分词能力较弱的问题,本文利用本体中定义的
概念和实例,添加适合农作物病虫害信息的中文分词器,以达到更好
的分词效果。
基于以上工作,本文实现了一个农作物病虫害信息抽取和检索系
统,有效地实现了中文网页上的农作物病虫害信息抽取和全文检索。
关键词:信息抽取,网页分块,领域本体,Lucene,倒排索引
ResearchonInformationExtractionandFullText
Articles
Retrievalof Diseases
Crop
ABSTRACT
withthe increaseofthenetwork
您可能关注的文档
最近下载
- D-Z-T 0462.3-2023 矿产资源“三率”指标要求 第3部分:铁、锰、铬、钒、钛(正式版).docx VIP
- 网络系统建设与运维中级 第7章 IPv6协议v3.2.pptx VIP
- 电子科技大学-2018.6月计算复杂性考试.docx VIP
- 吊篮施工计算书.pdf VIP
- 基于PLC的三工位钻床工作台控制系统设计.pptx VIP
- 化工仪表及自动化课件共58张PPT).pptx VIP
- 光固化胶水知识讲座课件.ppt VIP
- EN_IEC_61800-3-2018 可调速电力驱动系统第3部分:EMC要求和具体测试方法.pdf VIP
- 运动性肌肉损伤诊疗专家共识(2026版).docx
- AKH-0.66-200X50II低压电流互感器规格书.pdf VIP
原创力文档

文档评论(0)