大规模本体分块与映射中一种新块映射策略.docVIP

大规模本体分块与映射中一种新块映射策略.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大规模本体分块与映射中一种新块映射策略

大规模本体分块与映射中一种新块映射策略   摘 要:现有的大规模本体分块与映射系统中大多采用基于参考点的块映射策略,映射策略比较单一,块映射质量不高。因此,提出一种新的基于本体块结构的块映射策略,通过重建本体块结构图来获取块与块之间在结构上的相似度,并将其和基于参考点的策略相结合,通过加权求和得到总的相似度。理论分析和实验结果表明,本文的方法块映射准确率高。   关键词:大规模本体;块映射;参考点;本体块结构图   中图分类号: TP391 文献标识码:A      1 引 言   在大规模本体分块与映射问题中,除了要保证分块质量之外,块映射质量也是一个不容忽视的重要问题。因为,如果分块质量很好,但是块映射质量不好,即产生错误的块映射,这会导致存在映射的两个实体对得不到匹配,造成最终大规模本体映射的整体质量不高,或者说对查全率和查准率都有影响,因此,在对大规模本体进行分块之后,如何找到一种最佳的块映射策略,也是需要研究的一个重要问题。   2 相关工作   目前,国内外学者在大规模本体分块与映射方面研究不是很多,而且大多数专注于对大规模本体的分块[1-3],在块映射方面,文献[2]提出了基于参考点的方法。参考点被定义为具有很高相似度的实体对,是在进行块映射之前预先找好的,一般能够通过比较简单的映射策略找到,比如字符串匹配,近义词关系,在WordNet词典中具有近义词或者相等关系,另外还可以利用本体可视化工具,如protégé[4],通过人工识别来获取,不过由于这种方法不利于映射系统的自动化程度,一般不会采用,只在前面几种方法找到的参考点比较少的情况下才采取这种方法。该方法的主要是通过考察参考点在各个块中的分布来来计算块块之间的计算各个块之间的相似度。其主要思想是两个块之间的参考点个数越多,则这两个块之间的相似度越高,反之,如果两个块之间的参考点越少,他们的相似度越低。因此,对于那些在名称上异构的本体对,找到的参考点就会很少,使得块映射质量不高。   3 基于本体块结构的块映射策略   3.1 问题描述   目前解决大规模本体映射问题的最主要的方法采用分治法的思想,先对大规模本体进行分块,然后在块与块之间进行映射发现,从而将大规模本体映射问题转化成普通本体映射问题。因此,对大规模本体进行分块之后,最重要的一个问题就是找到互相匹配的块。由于一个块中往往包含很多个实体元素,如概念,属性,实例等,要直接计算两个块之间的相似度,就要计算块与块之间各个元素之间的相似度,这样的话不仅违背了分治法思想的初衷,也是一件时间复杂度非常高的事情。   因此,大部分的大规模本体映射系统都采用启发式的方法来寻找块映射,如本文在第二章相关工作中介绍的基于参考点的方法,该方法并没有精确的计算出各个块之间的相似度,且块映射的准确度完全依赖参考点的数量,参考点的数量越多,块映射的准确度越高,反之,参考点数量越少,块映射的准确度越低。   本体映射问题主要是为了解决不同本体之间的异构,由于本体异构有不同的表现形式,如名称异构、结构异构、实例异构等等。因此,对于不同的本体映射任务,仅仅采用基于参考点的块映射策略未必有效,因为有的本体之间在名称上异构很严重,会导致找到的参考点非常少,这对发现块映射是很不利的,因此,除了采用基于参考点的策略之外,寻找更多块映射策略,提高块映射的准确度。   本体中包含丰富的语义信息,而基于参考点的策略仅仅只利用了本体语言学方面的信息。由于本体具有高度结构化的特征,本体中的实体在结构上都是紧密相连的,这主要通过本体各种关系来体现,其中最重要的就是本体中的is-a关系,通过is-a关系,本体可以组织成一个树状结构,被is-a关系相连接的两个实体具有继承关系。因此,本文考虑利用本体结构上的信息来发现帮助发现块?┯成洹?   计算技术与自动化2011年9月   第30卷第3期徐德智等:大规模本体分块与映射中一种新的块映射策略   在普通本体映射策略中[5],有一种基于结构的策略,其基本的思想是利用本体中结构上的信息来计算实体之间的相似度,即在本体树中,如果两个实体结点的父节点相似,那么这两个节点有可能相似;如果两个实体结点的子节点相似,那么这两个实体结点有可能相似;如果两个结点的兄弟节点相似,那个这两个结点有可能相似;如果两个实体结点具有相同的实例,那么这两个结点相似;如果两个实体具有相同的属性,那么这个实体结点可能相似。如果两个属性具有相同的rang和domain,那么它们也可能相似。因此本文考虑利用本体结构上的信息来帮助发现块映射。   3.2 构建本体块结构图   在大规模本体匹配任务中,对大规模本体进行分块后,待映射的两个本体被分割成两个本体块集合,但是本体块之间仍然存在结构上的联系,因此,本文

您可能关注的文档

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档