基于领域本体农作物病虫害问题分类研究.docVIP

基于领域本体农作物病虫害问题分类研究.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于领域本体农作物病虫害问题分类研究

基于领域本体农作物病虫害问题分类研究   摘要:问题分类是问答系统的重要组成部分,其作用是将问题划分到对应的类别里以提高问答系统的准确率。本研究提出了一种基于领域本体的农作物病虫害问题分类方法,该方法首先构建农作物病虫害领域本体,将领域本体中的领域词添加到分词系统中以提高分词的准确率。然后提取特征词,并利用同义词词林和领域本体对特征词进行扩展。最后,针对农作物病虫害领域的特殊性将问题分为4类,利用语义和规则相结合的问题分类方法对问题分类。试验结果表明,该方法有助于提高问题分类的准确率。   关键词:农作物病虫害;领域本体;特征词扩展;问题分类   中图分类号: TP391;S126 文献标志码: A   文章编号:1002-1302(2016)09-0145-03   长期以来,病虫害一直是影响农作物产量的主要问题,每年因病虫害损失的粮食约有250亿kg,有效预防和控制病虫害的发展对于提高农作物产量有着重要的意义。问答系统是一种能够对用户输入的问题进行快速分析并准确地返回答案的智能系统。为农民提供一个病虫害领域的问答系统,可以为农民在农作物种植过程中出现的疑难问题提供实时指导,进而减少粮食的损失。问答系统的工作流程一般分为3个阶段:问题分析、答案检索和返回答案。问题分类是问句分析阶段需要解决的关键问题,它对答案的抽取有着指导意义[1],例如问句“玉米螟虫最佳防治时机是什么时候?”如果能够分析出该问句为询问时间类,答案的抽取则具有一定针对性,答案抽取的准确率也会提高。   传统问答系统对问句的分析只利用问句的表层特征信息,并没有考虑问句的语义特征,导致问答系统抽取到的答案准确率较低[2]。本体是一种语义层次的领域知识建模工具,对概念及概念之间的关系进行明确定义[3]。本体用形式化定义领域内的各种资源及资源之间的联系,不仅使知识的语义信息更加丰富[4],而且还具有重用性和知识推理的特点。本研究针对农作物病虫害领域的特殊性,基于本体理论,搜集农作物种植过程中的病虫害知识,构建农作物病虫害知识本体,将本体运用在病虫害问答系统中问题分类的整个过程中,提高问题分类的准确率。本课题研究的主要问题有农作物病虫害本体构建、特征词扩展及问题分类。   1 基于领域本体的问题分类总体框架[ST]   对问题进行分类首先需要将问题变为计算机能够理解的形式化语言,常用的处理方法是将句子变为由特征词组成的向量空间模型,处理过程包括:预处理和特征词抽取及扩展,领域本体贯穿于整个阶段。问题分类工作流程如图1所示。   (1)预处理:语义分析的基础,包括分词、词性标注和去停用词。领域特征词普通分词系统还无法准确划分,因此需要将领域本体中的概念添加在分词系统中以提高分词的准确率。   (2)特征词抽取及扩展:特征词对句子理解起着关键作用。在候选答案句中可能包含特征词的同义词或者近义词,如果不进行特征词扩展有可能遗漏问题的答案,因此有必要对其适当扩展。   (3)问题分类:制定问题分类,并对每个类别制定特征词表和规则,采用基于语义和规则相结合的方法对问题分类。   2 基于领域本体的问题分类研究   2.1 农作物病虫害本体构建   领域本体是面向某一个特定领域的概念及概念之间关系的规范化描述。对于特定领域,其专业知识强,本体构建必须收集相关的领域知识,并且需要该领域的专家进行指导,这样才能使构建的本体更加合理[5]。本研究将农作物在种植过程中病虫害问题的相关概念及其之间的关系组织起来,形成可重用的农作物病虫害领域本体。   2.1.1 本体构建思路 本体的构建工作主要包括:领域相关知识的获取、领域概念的获取和领域概念的关系[6]。只有充分了解领域内的相关知识才能构建出高质量的本体。《农业科学叙词表》[7]提供了丰富的农业领域知识,利用《农业科学叙词表》中的领域概念及概念之间的关系可以减少构建本体的工作量。另外,由于《农业科学叙词表》形成已久,其中的概念和知识没有及时更新,因此,利用网络爬行工具对中国农业信息网、农林网等专业领域网站进行知识抽取以便及时补充和更新知识概念。最后,由领域专家对知识进行检查整理,去除抽取错误的知识,合并重复知识,确保构建本体的准确性。构建方法如图2所示。   2.1.2 农作物病虫害本体构建 农作物病虫害本体包括类、属性和实例3个组成部分。类即概念,是本体的重要组成部分,属性和实例都是对类的说明。对本体的构建首先需要将类按照合理的层次组织起来,类的获取参考《农业科学叙词表》中的分类,并根据本研究构建的农作物病虫害本体的实际需求,将顶层类分为农作物、病害、虫害、防治方法4类,农作物类又划分为禾谷类、豆类、经济类、薯类、蔬菜类和果树类。本体概念层次如图3所示。属性是描述类之间的关系,例如特征和颜色表示值―属

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档