- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于相似度综合计算的本体映射方法的研究
摘要:语义异构问题已成为目前异构数据集成领域的研究热点,本体由于其自身的优势而被用于解决语义异构。该文讨论了基于相似度的本体映射方法,着重介绍了基于语法距离、基于WordNet语义字典以及基于结构的相似度计算,最后提出了本体映射生成算法,旨在解决语义异构中本体映射问题。
关键字:语义异构;本体;相似度计算
中图分类号:TP311 文献标识码:A文章编号:1009-3044(2009)04-0841-03
The Research of Ontology Mapping Method Based on Composite Computing Similarity
LI Jia-qiang,YAN Nan-nan
(Shanghai Maritime University College of Information Engineering,Shanghai 200135,China)
Abstract: Semantics heterogeneity has been a hot research spot in recent data integration field.Ontology has been used for solving semantics owing to its strengths.Firstly,the paper discusses ontology mapping method based on similarity.Secondly,computing similarity based on grammar distance,Wordnet semantics dictionary and structure is mainly introduced.At last,the algorithm of producing ontology mapping is put forward,aimed to solve the problem of ontology mapping in semantics heterogeneity.
Key words:semantics heterogeneity;ontology;computing similarity
1 本体映射概述
本体映射是指本体间存在语义级的概念关联,通过语义关联,实现将源本体的实例映射到目标本体的过程[1]。本体映射是语义Web、语义数据搜索、数据集成等研究中的重要方法,也是本体融合、本体集成、本体翻译等技术的基础。在基于本体的异构数据集成中,本体映射是解决语义异构问题的关键。本体之间的映射主要包括1:1、1:n、n:1、1:null、null:1和n:m共6种映射模型[2]。目前的映射方法能处理的映射类型非常有限,大多数研究都集中于1:1的映射模型。对于1:1的映射,有以下定义:当本体О1中的第i个元素与本体О2中的第j个元素的相似度Sim(e1i,e2j)大于某个设定的阈值时,称这两个元素之间符合映射关系map(e1i)=e2j。综上,可以看出本体映射过程实际上就是找到元素i,j之间所有的元素映射关系并进行映射和转换的过程。
2 本体映射的研究现状
目前国内外在本体映射领域已经有了一些具体的映射方法和系统。例如,Karlsruhe大学开发的MAFRA系统[3]包括了映射的发现、表达和执行的映射框架。由清华大学的唐杰等人基于贝叶斯决策理论提出的RiMOM映射模型[4],将映射发现问题转换成最小风险问题,提供了一个多策略的本体映射方法。
3 本体相似度的计算
在本体之间建立语义关联,实现本体映射,关键在于发现相同或者相似的元素间的映射关系。相似度计算便成为本体映射中发现映射关系的重要方法。
3.1 基于语法距离的相似度计算
基于语法的相似度计算方法针对本体的概念、属性的语法特征进行计算相似度。基于语法的相似度计算易于实现,适用范围广。由于概念的名称,属性名称等都是字符串在具体实现上,采用基于编辑距离(Edit Distance)的方法[5]。算法实现如下:
算法1:编辑距离的动态规划算法
Function EditDistance(str1,str2);
输入:字符串str1和str2
输出:字符串str1和str2之间的编辑距离edit (str1 ,str2)
设字符串str1和str2的长度分别为n,m。
If(n=0) return m and exit;
If(m=0) return n and exit.
构造二维数组d[m+1][n+1]。
文档评论(0)