元数据与知识本体-数图研究笔记.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
元数据与知识本体-数图研究笔记.doc

元数据与知识本体 Ontology-based Metadata Application for Digital Libraries 刘炜 上海图书馆 200031 李大玲 夏翠娟 华东师范大学信息学系 200062 摘要:本文简要分析了知识本体对于数字图书馆的作用,论述了知识本体概念的来历、含义和目前的研究与应用进展,以及知识本体与传统的图书分类法和叙词表的关系,着重阐述了知识本体对于元数据方案所起到的补充和高层互操作的作用,以及建立知识本体的一般流程和方法。 Abstract: An ontology is a formal specification of a conceptualization, usually related to a specific domain of knowledge like library and information science. The metadata application profile along with the documentation of its abstract model can be thought of a primitive ontology of a specific implementation. Classification themes and thesaurus, which have been used for a long time in the library and information arena, are also a source of formal ontologies. After formalization processing and encoded with standard ontology languages, these kinds of concept systems can be very useful to establish a metadata service based on ontology services and fulfill the high level interoperability of digital libraries. 关键词:元数据,知识本体,数字图书馆,异构性 Keywords: metadata, ontology, digital library, interoperability 元数据在国内依然是一个热门概念,然而很多图书馆员可能没有意识到,制定和应用元数据规范,虽然最终是为人服务的,但实际上是在为机器打工——为了在分布式网络环境下实现机器与机器之间的语义理解而制定规则。元数据方案能够做到这一点,除了必须采用标准的属性元素集之外,还得益于采用标准的编码语言(例如RDF)进行编码(又叫置标),将各种具体的约束(例如数据类型、是否必备、是否可重复等等)进行明确地定义,这个过程在计算机语言中叫做“形式化”。只有经过形式化的元数据方案才能保证具体的查询请求在联网的资源库之间“拷贝不走样”,从而能够使人在整个网络中获取全面而准确的信息。 但是要全面实现数字图书馆的功能,仅仅依靠元数据方案的形式化是不够的,还必须借助知识本体的作用。同样地,为了计算机能够处理,知识本体也需要进行严格“形式化”。对于“知识本体”进行形式化和应用的研究已经是计算机界的一个“热门”领域,很快也会成为图书情报界的一个热门概念,因为对于知识的分类和管理历来是图书馆员的本行,而元数据的发展历程说明,计算机界没有必要“重新发明轮子”。 数字图书馆究竟有什么特别的功能需要知识本体来实现?什么是知识本体?与元数据的关系是什么?本体又如何进行形式化?形式化的本体能够起到怎样的作用?它又是如何起作用的?本文试图对上述问题进行简要的讨论。 数字图书馆功能需求 解决分布式网络环境下系统或资源间的互操作问题是数字图书馆技术的核心内容。“异构”是指系统或资源在结构上的不同,互操作是指系统或资源之间的兼容性或关联关系。万维网是目前最大的开放的分布式网络,可以看成由无数三层结构应用 三层结构应用指由“浏览器-Web服务器-数据库服务器”组成的应用体系,俗称动态网页技术,相对于将所有发布内容均以html文件形式存放于Web服务器的B/S两层结构而言。 组成的大型资源库群(repositories)。这些资源库群是彻底异构的,从数据结构、操作系统,到数据库系统,到应用系统;从命名方式,到数据格式,到结构模型,到用户界面,都有可能完全不同,目前没有多少标准规范能够对这个各个层次的异构进行适当的约束,数字图书馆在这个方面尚缺乏完整解决方案,而且解决方案也不是唯一的。从体系结构上来看,“语义万维网”和“Web服务”技术正在形成一套异构

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档