都柏林核心(Dublin Core)元数据发展简史教材.doc

都柏林核心(Dublin Core)元数据发展简史教材.doc

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
都柏林核心(Dublin Core)元数据发展简史 上海图书馆数字化工作部   随着WWW的不断发展,网络上信息资源正呈不断增多的趋势。但随之而来的问题是,人们发现在海量的信息环境中,信息的查找和检索变得越来越困难。网络上充斥着各种各样的信息,但人们却不知道究竟该怎样才能找到自己所需要的信息。 为了有效地解决查找网络资源这一问题,元数据这一概念被提了出来。元数据也被称为是关于数据的数据,它是专门用来描述数据的特征和属性的。由于电子文件所具备的多种多样的格式和控制方法,它们可能不能被每个人直接使用:因为也许人们不熟悉或不了解它的格式;也许它的内容被加密了;或者它只有在交费后才能被接受;也或者这个资源太大,存取起来既困难又费时。在这些情况下,元数据能支持用户决策过程。它包含的数据元素集就是用来描述一个信息对象的内容和位置,以便能在网络中方便的查找和检索。 从元数据提供者的角度来看,元数据能改进文件的检索能力(特别是搜索的精确性)、以及对藏品的控制和管理问题。而各种网络上的搜索引擎,如Lycos、Alta Vista、Open Text等,虽然对许多资源有自动索引功能,但其查准率却极低。而一些由专业人员提供的不仅复杂并被结构化的特殊体系方案,如MARC、GILS、TEI header、IAFA模块(用来描述匿名的FTP档案和基于主题的信息网关)和FGDC,这些标准虽然能达到一定的查准率,但在数据加工标引工作上既费时又费人工,并且需要的是专业的从业人员,因此对于充斥于网上的海量信息可以说是无能为力。这些复杂的体系方案通常都需要大量的时间,金钱和合格的职员,因此创造一个更简单的元数据模型和体系方案显得非常吸引人。而且,随着因特网上的搜索服务的改进,从各种复杂或简单的元数据格式到各个不同的用户团体之间,也特别需要一种标准化的语言或交换格式。 所以,创立一个简单的、并且在网络中为各个用户团体所接受的标准化元数据元素集,成为了网络发展的迫切需要。1995年3月在都柏林召开的第一届元数据研讨会上,经过与会代表的商讨和辩论,终于产生了一个精简的元数据集——都柏林核心元素集(Dublin Core Element Set),简称为都柏林核心(DC)。由于它的简练、易于理解、可扩展、及能与其它元数据形式进行桥接等特性,使它成为了一个良好的网络资源描述元数据集。这次会议之后又召开了五次元数据研讨会,每次会议都对DC进行了一定的补充和修订,使DC在结构和功能上逐渐的完善起来。DC能较好地解决网络资源的发现、控制和管理问题,因此对于现在的数字图书馆研究很有意义。现在研究及采纳DC的各种项目已遍及美洲、欧洲、大洋州、亚洲等地,DC已被翻译成了二十多种语言。1998年9月,因特网工程专题组(IETF)也正式接受了DC这一网络资源的描述方式,将其作为一个正式标准予以发布(RFC2413)。 本文是一篇关于DC的产生及其发展历史的简要概括,文中对各次会议都依次作了介绍。相信在读完本篇后,能使你对DC这一目前在国外数字图书馆及网络资源描述方面有重要意义的元数据集有一个基本的、粗略的了解。   DC-1 1995年3月1-3日,第一届元数据研讨会在美国俄亥俄州的Dublin召开。会议由联机图书馆中心(OCLC)和美国超级计算应用中心(NCSA)主持。与会代表包括来自图书馆界、档案界、人文学界和地理学界,以及来自Z39.50和通用标记语言标准(SGML)集团的代表。大会的目的旨在确定所研究的问题的范围,即是否只要一个简单的元数据元素集就能对网上的各种主题资源进行描述,会议为进一步发展描述电子资源的元数据元素的定义打下基础。 由于资源描述的广泛性以及复杂性使商讨的范围受到了限制。现在网络上的绝大部分信息对象都被看作是“文件”,而元数据记录是用来直接帮助发现因特网上的资源的,因此提出的一套元数据元素集旨在描述支持电子文件资源的发现的基本特性。而其它涉及成本核算或档案的信息,都不在商谈之内。 在这次会议中,专题组的目的主要是为了培养对当前问题的一般性的认识,以及主要涉及者可能会采取的解决方法,并提出一个核心元数据元素集来描述网络上的电子资源。会议目标主要是为了定义一个能被全球所理解接受的小的元数据元素集,它能允许作者和信息提供者自己来描述自己的工作,并能方便资源发现工具之间的互操作性。但是核心元素并不能满足特殊用户团体需要的对象描述。 这届研讨会最主要的成果是设定了一个包含十三个元素的都柏林核心元素集:Dublin Core(或简称为都柏林核心DC)。都柏林核心是在网络环境如因特网中,帮助发现文件类对象所需要的的最小元数据元素集。而它的结构句法问题则作为一个执行细节没有进行详细说明。[DC-1] DC-1所定义的十三个元素如下,在后文中可以看到,这十三个元素在以后的DC发展中

文档评论(0)

187****5045 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档