关联数据映射语言及发展.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关联数据映射语言及发展

关联数据映射语言的发展 1 引言 2010年11月,关联开放数据(Linking Open Data,LOD)项目组发布了关联数据规范,其核心规范/协议模型见图1[1]。 图1 关联数据规范/协议 由上述规范/协议结合关联数据发布规则可知,关联数据的本质是将本体和相关数据资源按照RDF格式的标准链接起来,同时要求支持HTTP URI访问和RDF查询语言SPARQL检索。根据W3C SWEO研究组的统计,截至2011年9月,关联数据云(LOD Cloud)含有310亿个 RDF三元组,5亿个RDF链接[2](见图2)。由此推算,涉及关联关系的三元组与三元组总量之比不到3.5%,96%的RDF三元组有建立 RDF链接的潜力却无RDF关联。随着关联数据云中实例数据的快速增长,这一矛盾将进一步加剧。 图2 关联数据云2007—2011年增长态势 针对发布后的关联数据集,不同数据源用多种本体词汇描述相同实体类型,RDF关联表现为对上述相同实体创建RDF类型关联。创建更多RDF关联受词汇异构和实例属性值关系的制约。基于此,国外学者初步形成了发现关联和映射关联两种思路。其中,发现关联是利用已创建的直接关联发现更多不同数据集间的间接关联,从而达到创建更多RDF链接的目的。近年来研究集中在运用一定的方法发现实例记录的等同关系,代表成果包括机器学习方法[3-5]、各种相似度算法应用[6-8]、实例关联工具的开发[9-11]等。与上述思路不同,映射关联从描述数据集的本体词汇出发,消除因不同数据集对相同属性采用多种本体词汇进行描述导致的类或属性异构。由于关联数据规范允许数据发布者自由选择多种本体词汇混合使用以支持实例表示的灵活性,因此,这种自描述方式[12]形成的词汇异构在LOD中十分普遍,克服词汇异构有助于推动更多实例记录关联的创建。 由于缺乏细粒度的映射机制对描述关联数据集的本体词汇进行深层整合,RDF关联主要限于实例层,例如通过传统描述方法如owl: sameAs、skos:exactMatch等建立实例等同关联[13],此外也有用rdfs:subClassOf、rdfs:subPropenyOf、owl:equivalentClass、owl:equivalentProperty揭示不同本体词汇的等同或包含关系。受词汇异构的制约,更广泛的RDF关联无法得到揭示。面对上述困境,德国柏林自由大学学者比泽和舒尔茨提出关联数据映射框架R2R[14],该方法拓展了RDF关联思路,丰富了映射关联机制,为 LOD构建面向领域应用的集成服务环境提供了新途径。 R2R语言是比泽和舒尔茨于2010年夏季发布的RDF指令语言,目前还处于发展阶段。尽管如此,R2R语言的简洁性、易扩展性、描述的细粒度以及与语义网联系紧密等特点已逐渐引起人们的重视。2009年以来,关联数据的研究已引起国内图书情报界的广泛兴趣,但尚未发现运用R2R语言探索关联数据映射的成果,R2R研究尚未与国际同步。为此,本文在研究 R2R框架的基础上,结合在Eclipse HELIOS(集成JDK 1.6)平台中通过映射处理程序接口调用 R2R映射实例的体会,向国内同行解读R2R语言在关联数据映射中的用法。 2 R2R语言 R2R语言的特色在于一方面能够实现不同 RDF数据集术语映射的创建,另一方面可使生成的映射直接发布为关联数据。作为R2R框架的组成部分。R2R语言包括映射属性、表示规则、函数与修饰符、映射元数据等内容[15]。 2.1 映射属性 映射属性是R2R语言的基础,通过映射属性可创建不同的映射语句,为不同类型RDF词汇表(本体)类或属性构建映射。其类型有六种,如表1所示。 R2R定义了ClassMapping和propertyMapping两种映射类型的类。类在R2R映射语句中充当宾语,声明创建映射的类型,而映射属性为谓语。映射声明、源模式和目标模式语句属强制类型,任何R2R映射均要采用;其他映射属性属非强制类型,其应用根据需求适时采用。例1反映了上述属性在具体环境中的用法。 例1: @prefix mp: <http:// www4. wiwiss. fu-berlin. de/R2Rmappings/>. mp: DBpediaToFoafMapping rdf: type r2r: ClassMapping; r2r: prefixDefinitions “fog: <http:// xmlns. com/foaf/0. 1/>. dbpedia: <http:// dbpedia. org/ ontology/>”; r2r:

您可能关注的文档

文档评论(0)

liwenhua00 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档