基于本体概念相似度计算探究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于本体概念相似度计算探究

基于本体概念相似度计算探究摘要:本文基于OWL本体的属性和层次关系,给出一个综合概念相似度计算模型,计算概念之间的柔性相似度,并通过实验验证了模型的有效性。 关键词:OWL;相似度;本体 中图分类号:TP301.6文献标识码:A文章编号:1007-9599 (2012) 05-0000-02 一、引言 本体可以提供强大的知识表示方法,是信息检索领域中的重要内容。传统的本体概念相似度计算方法大多采用特定于描述语言的通用推理服务来进行匹配,这些方法忽略了概念的语义信息。在概念检索或语义查询系统的实验过程中,利用本体对领域知识进行建模,使查询结果满足语义方面的匹配,避免了基于关键字进行简单查询的局限性,在构建基于本体的语义信息检索系统的过程中,提高了查询结果的准确率和召回率。 二、本体描述语言OWL OWL(Web Ontology Language)是语义Web中本体描述语言的标准。OWL在资源描述框架RDF(Resource Description Framework)的基础上,添加了更多的语义结构的声明,从而对RDF进行了扩展。OWL语言建立在描述逻辑DL(Description Logic)的基础上,因此OWL具备良好的知识表示能力和机器推理能力。领域知识本体可以做如下定义: Onto=(V,C,P,H,R) (1) 其中:V表示概念词汇集,C表示本体概念,P表示属性,H表示层次,R表示概念之间的关系。 分析OWL语言中描述元素,对于基于语义特征的概念相似度计算方法非常重要。OWL语言中有四类不同的语义描述元素: 第一类描述元素用于定义本体中实体集合,主要包括类Class和实例Instance。 第二类描述元素用于生成一个本体的特征集合,包括描述本体实体的类层次描述元素和属性特征描述元素以及其他各种约束的描述元素。 第三类是用于描述实体之间,以及特征之间的异同关系的描述元素。 第四类是本体中的补充性的描述元素,以及现有算法尚不能有效支持的特征。 三、基于本体的概念相似度计算 (一)属性相似度 在现实世界中,事物可以由各种属性来进行描述和分类,属性的相似度可以通过两个概念属性集合的相似程度来进行计算。 其中,Ci∩Cj表示概念Ci与概念Cj的相同属性集合;Ci-Cj表示在概念Ci中存在而概念Cj不存在的属性集合;Cj-Ci表示在概念Cj中存在而在概念Ci中不存在的属性集合,α,β,γ为调节权重参数,且α>β=γ。 (二)语义层次距离 本体作为一种知识表示模型,其所包含的概念、属性和关系可以通过有向图的形式进行表示,节点表示概念,边表示关系,概念之间的语义距离可以表示为概念节点之间最短路径边的数目,用 表示。语义相似度和语义距离之间存在如下对应关系: 1.两个概念间的语义距离为0时,其相似度为1; 2.两个概念间的语义距离为无穷大时,其相似度为0; 3.两个概念间的语义距离越大,其相似度越小。 在本体中,如果两个概念的语义距离相同,那么概念的语义相似度由它们所处的层次决定,所处的层次越深,其所对应的语义相似度越高,反之则相反。 其中,h为本体有向图的最大深度,L为概念Ci和Cj之间有向边的数量。考虑到层次深度对语义相似性的影响,同时,层次深度也能判断出两个概念的上下位关系。综合考虑语义距离和层次深度,可以使用树形结构来对本体进行表示. 其中,hi和hj分别表示概念Ci和Cj在本体树中的深度; 表示本体树的最大深度; 为调节参数,对系统所需的相似度进行动态调节,表示本体树中深度和广度对概念相似度的影响。 (三)基于属性和语义距离的柔性相似度 本体概念的相似度要综合考虑概念的属性以及概念之间的关系,它们对概念的相似度具有重要的影响。综合考虑概念的属性和层次关系对概念相似度的影响,对公式进行权重调整,得到领域本体中两个概念的相似度计算模型. 其中, 是权重系数。由于概念相似度的主观性较强,因此对于不同的服务请求,可以通过权重系数的调节来决定本体概念的属性和层次关系对相似度的影响,从而确定系统所需要的相似度阈值。概念相似度的变化趋势是一种线形关系,参数的取值会影响相似度的大小,但是对概念的相似顺序没有影响。 (四)算法描述 给定相似度算法sim(Ci,Cj),该算法最主要的工作是计算两个概念的相似度。相似度算法描述如下: 第一步:预处理。构建相似度矩阵A,提供任意两个概念之间的相似度度量,其中Aij=sim(Ci,Cj)。显式定义所有的等价概念和反义概念的概念元素集合,赋值为1和0,在相似度矩阵A中,除了能被初始化的元素,其它每个概念的取值都与中参数取值

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档