- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第30卷第3期 华 东 交 通 大 学 学 报 Vo1.3O NO.3
2013年6月 Journal of East China Jiaotong University Jun.,2013
文章编号:1005.0523(2013)03.0082.07
图解析方式的复合本体映射策略研究
凌仕勇 ,龚锦红
(华东交通大学 1.软件学院;2.电子与电气工程学院,江西南昌330013)
摘要:针对本体复杂上下文关系,考虑不同输入模式,构建通用环境下的本体解析 图描述。在结合本体结构基础上,建立多
层本体结构图描述关系;引入上下文关联的相似度传播建立结构传播因子和实例传播算法;引入快速匹配算法用于本体的
快速映射 ;最终提 出一种复合本体映射策略,利用重用迭代得到本体的映射结果。最后通过算法复杂度的分析和一些对比
测试证明了策略的可行性和有效性。
关键词:复合本体映射;本体图解析;相似度传播 ;快速匹配算法
中图分类号:TP3l1 文献标志码:A
本体映射在许多应用领域都起到重要的作用,如模式集成、语义WEB、数据仓库、电子商务、智能体通
信、WEB服务组合、目录映射等。很多前期研究往往侧重于本体的概念、属性、实例等特定模式,而忽视本
体上下文结构的分析。近来,出现了大量基于英文语料库Wordnet和中文语料库Hownet的词 [相似研究,
这些研究语料的词汇相似度计算是构成本体概念相似度计算的基础。但是,对于本体本身的研究主要集
中于单纯的概念、属性以及实例,如QOMn],ASMOM ],RiMOM_3]。COMA是由德国莱比锡大学开发的一套
集本体解析,匹配,测试和评估的开源映射系统 (http://sourceforge.net/projects/coma—ce/),COMA解析各种
格式输入文件 (XML,RDF,OwL)成一种内部结构 ,通过这种结构与匹配算法 ,输入输出,数据库 (默认
mysql,可以自定义算法接人系统接 口)进行交互。提供一套工作流用于定义输人文本的格式,匹配算法,
相似度计算的算法(外部接 口库align一4.2一ontowrap.jar),输出文件的格式(xml,htm1)。新版COMA++4『支持
不同的输入如XMLSchema,RDF,OWL,引入了概念间的关系,但本身没有引入基于语料库的词汇计算,不
支持本体结构的相似度传播 ,并且在映射时为了顾及一般化的多对多映射而采用单向或双向完全遍历的
方法 ,使得复杂度大为增加。S-Match是由意大利特伦托大学FaustoGiunehiglia教授主持开发的一套开
源语义映射算法 (http://sourceforge.net/apps/trac/s—mateh/wiki/),S-Match将待映射的两个文件解析成树形
结构,然后计算两个树节点之间的语义关系,进而找出映射关系。其语义计算分2个步骤 :首先解析两树的
标签属性,类似于本体的概念名称,通过元素级别的匹配库计算标签概念的语义关系;其次解析两树的节
点,类似于本体的概念属性,通过节点级别的匹配库计算节点间的语义关系。其词汇计算的核心是通过
WordNet词汇库进行语义相似度的计算。S-Match充分考虑了语义库的支持和计算方法 ,但对应本体结构
和映射策略并没有给予过多的支持。
对于输入模式的解析上,除了需要考虑本体的概念,属性外,还需要考虑本体之间的上下文结构关系,
本体所拥有的实例。本文将本体或其它的输人模式解析成一种图描述的结构,这种结构不依赖于任何特
收稿 日期:2013.02.25
基金项目:江西省 自然科学基金项 目(20122BAB201040);江西省教育厅青年科学基金项 目(GJJllll5);华东交通大学科研
项 目(12RJ04)
作者简介:凌仕勇(1974--),男,高级工程师,硕士,主要研究方向为语义wEB、并行运算、网络安全。
第3期 凌仕勇,等:图解析方式的复合本体映射策略研究 83
定的语义,可以接受其它类型的输人模式如XML,文本结构 ,数据库模式等等。并从3个层次上对输入进
行描述:节点层次上的图定位,用于解析图的顶点描述;概念关系层次上的结构图分析,用于解析图的边描
述;语义上的结构图比较,用于节
文档评论(0)