- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数 字图 书馆论坛
国外常用元数据标准比较研究
口冯项云 肖珑 廖三三 庄纪林
★
摘要 通过 时 目前 国际上较流行 的七种元数据标 准 CDWA、DC、EAD、FGDC、GILs、TEI、 VRA的介绍、比较和分析 ,总结出元数据标准在设计和实现过程中的几个关键问题。 关键词 元数据 CDWA DC EAD FGDC GILS TEI VRA
元数据标准的设计与实现是数字图书馆建设 过程中首要的、基础性的工作。目前国外已经产生 并得到实际应用或试验的元数据标准有 20余种。 本项 目对其中七种进行了比较分析研究,并由此总 结出元数据标准在设计与实现过程中的几个关键 同题。
1 元数据概述 首先,需要对本文中所讨论的相关术语作出说 明: 元数据 :描述某种类型资源(或对象,即object) 的属性、并对这种资源进行定位和管理、同时有助 于数据检索的数据 元数据标准:如何描述某些特定类型资料的规 则集合 ,一般会包括语义层次上的著录规则,和语 法层次上的规定。语法层次上的规定有:描述所使 用的元语言,文档类型定义使用什么语法,具有内 容的元数据的格式 (也可以包括 内容数据 ,即 Content)及其描述方法。 编码(Encoding)规则:编码规则用于数据交换。 为了适合传输和存储,编码规则可以将数据信息按 独立于系统的数据结构进行编码。编码规则说明编 码数据的类型、有序排列、结构和编码模式,用于执 行编码服务。 在以下对国外元数据标准的比较研究中,使用 了实体分析方法来探讨各个元数据标准是如何对 著录对象进行描述的,从实体、属性、联系的角度分 析各个标准中元素/字段的设置和定义,以及产生 这些特点的实际背景。其次,还从元数据标准的功 能层次上比较了各个标准的功能。
从数据交换和信息共享的需要出发,元数据的 作用是传递可以理解的描述信息。对于计算机系统 来说,理解一条元数据记录的工作有以下几个步 骤 : 首先是理解元数据的各个元素或字段序列化 的方式,即按怎样的顺序和结构来组织各个元素及 其内容。根据使用描述元语言的不同,可能会包括 编码规则,以及记录格式。例如 MARC的 2709,就是
一 种被广泛使用的记录组织方式。当编码规则使用 置标语言的时候,通常会有两个层次上的格式,首 先是置标语言本身的语法规则 ,其次是对记录中使 用到的元素及其属性的说明(通常会以DTD或某种 Schema的形式存在)。其次需要理解某个给定元数 据标准是如何描述要著录的对象的,即对元素内容 的定义。 从上述的过程中可以看到.元数据标准的功能 层次可以依次划分为:对象/实体描述方面的规定、 编码/交换记录规则或传输元语言、与置标语言文 档一起使用的 DTD、传输/交换协议、检索属性方面 的规定,以及是否可以包括全文等规定。
2 国外常用元数据标准设计特点的比较与分析 本文对国际上比较有影响的七种元数据进行 了分析 和 比较 ,它们分别 是 CDWA、DC、EAD、 FGDC、GILS、TEI、VRA,这些元数据标准适用的著 录对象基本涵盖了目前可能处理到的资料类型。表 1列出了这七种元数据标准适用的资料类型,以及 使用目的。 元数据标准实现的功能都包括对资源的描述、 管理和定位,以及对资源的评估。但是由于它们分
本文系北京大学数字图书馆研究所 中文元数据标准研究 项目系统成果之一。
8_ 第 太 自 围 音 薛 号 赧
维普资讯
誉
苎 翔
大 学 固 奄 锥 号 赧
数 字 图书 馆 论 坛
表 1 七种元数据标准适用资料类型
CDWA 艺术品 从 事艺 术 历 史 对 艺术 品的 研 究 、艺 术 品 分类犏 目 管 理 的人 员 . 以 厦信 息 技 术 专家 艺术、建筑、史前 艺 术 品收 藏 单 方 便 描 述 艺 古景物、民间文化 位 术 类 可 视 化 等艺术类可视化资 资源 源 网络资源 任 何人 , 包 括 资源发现 C0 学 者 、专 家 、 学 生和 图 书 馆 犏 目人员 地理空间信息 政 府 ,酱 立 或 为 NSDI制 私 立研 究 机 构 作 、共 享地 或公司 理信息 GILS 政府的公用信息资 政府部门 方 便 盐 盘 查 源 找 定 位 公 用 的信息资潭 档案和手稿资源, 针 对 电子 文 包括文本和电子文 本 全 文 的编 档、可视材料和声 码标准 音记录 TEI 对电子形式全文的 电子 形 式 交 编码和描述 换 的文 本编 码标准
别适用于不同类型的信息资源,其使用者和所针对 的用户范围也有所不同,因此在元素的设置上,个 性化的特点非常突出。比如,可以说 CDWA、FGDC、 GILS、DC、VRA等均实现了上述功能,但其所包含 元 素 如 “orientati
文档评论(0)