书目数据RDF-XML序列化方法研究.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
? ? 书目数据RDF/XML序列化方法研究 ? ?   1 引言   书目数据是图书馆等文献服务机构进行文献管理、提供信息服务的重要工具,也是图书馆、档案馆等文献服务机构对人类知识进行组织、序化的重要成果。当前,书目数据以MARC格式为主,其结构的封闭性使图书馆服务始终游离于互联网信息服务之外,难以最大限度地发挥其使用价值及社会价值。为打破这一现状,适应未来语义网络的发展,将图书馆服务融入互联网信息服务之中,亟须对书目数据进行语义化和序列化。   为促进图书馆融入互联网并向语义网方向发展,国内外图书馆学界已经开展了由MARC到MARCXML[1-2]、MARCXML到FRBR[3],再进一步到BIBFRAME[4-5]的相关研究。虽然国内一些专家学者对此已进行了一些理论研究和探索[6-8],但还没有关联开放书目数据集的应用实例,也没有发现在线提供服务的关联书目数据集。而国外已有数家图书馆开展了关联书目数据的在线服务,最早的当属瑞典国家图书馆,于2008年开始提供关联书目数据的在线服务,而我国目前为止仍未提供这方面的服务。为尽快实现中文关联开放书目数据集的发布并提供服务,本文重点探讨书目数据RDF/XML序列化方法,并以MARCXML到BIBFRAME的序列化转换为例对该方法进行验证。   2 RDF序列化国内外相关研究现状   关联数据序列化,是指利用关联数据技术,采用特定本体或词汇集,对目标数据进行语义描述,并将其转换为某种关联数据格式的过程,如RDF/XML、N-triple等。书目数据序列化,是指利用关联数据技术,将传统书目数据(MARC格式)转换为可以被计算机识别、理解和处理的关联数据形式的过程,实质是关联数据序列化方法在图书馆领域的具体应用。   在关联数据序列化方面,国外走在相关研究的前列。应用方面,Teruaki Hayashi等[9]通过将行动计划中的场景信息序列化为RDF,创建了支持检索和复用的知识库,并用于帮助用户获取准确信息和决策支持;Xiang Sua[10]等将SenML①数据序列化为RDF格式,并应用于物联网智能服务领域,同时对该方法与其他替代方案进行了实验比较;Paul Croth等[11]围绕nanopublications②概念模型提出命名图RDF序列化方案,并采用现有技术对这一序列化方法进行了实现。以上研究大多是基于现有工具及本体来完成关联数据的序列化,侧重于应用。理论方面,Kim Y H等[12]提出使用现有XML文件转换为RDF格式的策略,并介绍了使用关系数据库存储RDF数据的方法;Hassanzadeh K等[13]提出了T2R系统,实现了从纯文本中自动获取句法与语义关系并序列化为RDF,最后通过个案研究实验对该系统方法进行了评估;Assem M V等[14]提出一种叙词表的RDF序列化方法,通过准备、语法转换、语义转换和标准化四个步骤,实现叙词表的RDF序列化,并以MeSH和WordNet为例进行了实证研究。   关联数据是指将目标数据集描述为关联数据形式,并将其发布为开放网络环境下可供查询及使用的形式的过程。关联数据序列化仅仅将目标数据集描述并转换为关联数据形式,是关联数据发布的一个环节。国内对关联数据序列化的相关理论研究较少,而且存在与关联数据发布相混淆的情况。贾君枝等[15]以DDC关联数据为例,从授权模型、实体对象明确、URI命名、SKOS模型化和RDF表示五个方面讨论了DDC关联数据的RDF表示和描述,并未涉及具体转换的实现方法。濮德敏[16]等讨论了关系型本体向关联数据转换的可行性,在此基础上对Virtuoso Universal Server、Triplify、D2R三种转换工具的使用进行了比较。夏翠娟等[17]在介绍利用Drupal发布关联数据的过程中,同时涉及利用Drupal CCK模块实现本体映射及关联数据转换。白林林等论述了从CNMARC到RDF的映射[18],建立了映射关系,但并未就映射的关联化转换及实现方法进行讨论。   当前,国内关联数据序列化研究没有对序列化与关联数据发布进行严格区分,现有研究大多只重点讨论了由MARC到RDF的映射,尚停留在实体映射阶段,未见关联数据序列化的具体理论与方法。这可能是造成国内没有书目数据关联开放数据集应用实例的重要原因之一。因此,本文重点探索了由MARCXML到BIBFRAME的具体序列化转换方法及途径。   3 书目数据RDF/XML序列化方法   “序列化”概念源自于计算机科学领域,原意是将内存中的对象转换为可以存储或传输的形式的过程,序列化后的对象实例数据可以被其他代码访问或修改。根据RDF 1.1 Primer的提法,序列化的内容是对RDF图(即实体及实体间关系)进行序列化。显然,序列化所涉及的实体类及关

文档评论(0)

资教之佳 + 关注
实名认证
文档贡献者

专注教学资源,助力教育转型!

版权声明书
用户编号:5301010332000022

1亿VIP精品文档

相关文档