元数据的多角度透视-上海交通大学图书馆.docVIP

元数据的多角度透视-上海交通大学图书馆.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
元数据的多角度透视-上海交通大学图书馆

元数据的多角度透视 郭志红 (上海交通大学情报研究所,上海200030) [摘 要] 本文对元数据的概念、相关格式、携带工具(RDF),以及数字化图书馆中元数据体系的内、外部系统和设计原则进行了探讨。并列举了两个元数据方案实例,以供借鉴。 [关键词] 元数据 数字化图书馆 RDF DC MARC 元数据体系 Multi-views of Metadata Guo Zhihong (Information Research Institute, Shanghai Jiaotong university, Shanghai 200030) Abstract This article discussed the concept of metadata, main sets and container for metadata, internal and external subsystems of metadata architecture and it’s design principle in digital library. Two instances for metadata scheme were introduced for reference.. Key words Metadata Digital library RDF DC MARC Metadata architecture 一 、元数据的概念 元数据最本质,最抽象的定义为:data about data (关于数据的数据)。它是一种广泛存在的现象,在许多顶域有其具体的定义和应用。 在数据仓库顶域中,元数据被定义为:描述数据及其环境的数据。一般来说,它有两方面的用途。首先,元数据能提供基于用户的信息,如记录数据项的业务描述信息的元数据能帮助用户使用数据。其次,元数据能支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。具体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:(1)描述哪些数据在数据仓库中;(2)定义要进入数据仓库中的数据和从数据仓库中产生的数据;(3)记录根据业务事件发生而随之进行的数据抽取工作时间安排;(4)记录并检测系统数据一致性的要求和执行情况;(5)衡量数据质量。 在软件构造顶域,元数据被定义为:在程序中不是被加工的对象,而是通过其值的改变来改变程序的行为的数据。它在运行过程中起着以解释方式控制程序行为的作用。在程序的不同位置配置不同值的元数据,就可以得到与原来等价的程序行为。 在图书馆与信息界,元数据被定义为:提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述。其作用为:描述信息资源或数据本身的特征和属性,规定数字化信息的组织,具有定位、发现、证明、评估,选择等功能。 此外,元数据在地理界,生命科学界等顶域也有其相应的定义和应用,在此不一一阐述。 、 主要元数据格式介绍 由于元数据的广泛存在,导致元数据格式层出不穷,在此就图书馆和信息界的几种主要元数据格式进行介绍。 1.艺术作品描述类目(CDWA): 是描述艺术作品的结构化工具,主要应用于艺术作品,珍善本和其它三维作品,它的描述重点在于“可动”的对象及其图像。它有27 个数据单元,每一单元还包括若干子单元,包括主题,记录,管理等项目。 2.编码文档描述(EAD): 主要用于描述档案和手稿资源,并利用网络检索和获取档案手稿类信息资源。其高层元素主要有:头标,前面事项,档案描述。每一高层元素又包括多个小项以及若干细项。它能适应任何长度的目录和记录,并能描述在各种媒介上的所有类型的档案。EAD体系由三部分组成:数据模型,SGML文件类型定义和档案目录。 3.VRA核心类目(VRA core): 最初是为在网络环境下对艺术,建筑等艺术类视觉资料的著录而起草,以后逐渐扩大应用到非艺术类顶域,目前VRA核心类目格式由两部分组成: 作品著录类目:用于任何一种作品实体或某种视觉文献所记载的原始作品(多为三维作品)的著录,包括作品类型,尺寸,主题等19个数据单元。 视觉文献著录类目:用于记载某种作品实体的视觉文献的著录,包括视觉文献类型,视觉文献格式等9个数据单元。 4.机读目录(MARC): 它被广泛用于图书馆书目记录数据,是目前图书馆描述、存储、交换、处理以及检索信息的基础。MARC记录的总体结构有以下特点:可变格式可变长字段的记录格式;采用目次方式;每条MARC记录分三个区(头标区,目次区,数据区)。 MARC格式遵循IS定,由以下几个部分组成,如图一所示。 MARC

文档评论(0)

daoqqzhuan2 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档