- 6
- 0
- 约2.81万字
- 约 32页
- 2016-12-19 发布于安徽
- 举报
word精品文档,支持编辑复制,内部资料,值得参考!
摘要
本体是概念模型的明确的规范说明。从知识共享的角度来看,本体是一种重要的概念化模型以及概念之间的关系表现形式。随着计算机的发展,本体论被越来越多的国内外学者所关注,也被运用到越来越多的应用领域里了,如:人工智能,搜索引擎,信息管理,工程项目,电子商务等。本体的形式化表示为五元组:类,关系,函数,公理,实例。本体目前国内外的学者的研究主要集中于:概念的抽取,关系的抽取盒学习,然而对函数学习以及公理的推断还处于初级阶段。本体的关系主要分为两类:分类关系,非分类关系。分类关系是:概念见的父类,子类的上下位关系,非分类关系是:除了分类关系以外的其他关系。其中关系的抽取主要集中于对分类关系的研究(kind-of关系),在加上非分类关系的种类多,方法研究不够完善,因此非分类关系的研究是目前本体论中一个研究难点。
目前国内外常用3种抽取非分类关系的方法:
①基于句法模式的方法是要基于语言学的知识基础上,通过分析文本来构建模式,使用简单的文本分析和无监督的机器学习来对文本中符合模型的概念,来抽取非分类关系。该方法的优点是准确率高,算法流程简单,能够抽取低频词汇的关系,缺点是需要人工构建模板,维护比较难,可移植性差。
②基于关联规则的方法是通过计算两个概念对出现的频率,来判断是否具有非分类关系,该方法的优点是步骤算法流程简单,准确率高,缺点是只能判断有没关系,不知道具体名称,只能处理低频词汇。
原创力文档

文档评论(0)