- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
5 信息资源描述的元数据方案 5.1 元数据概述 5.1.1 元数据的由来 数字化资源的飞速增长,造成两个方面的问题:1、传统的复杂的数据描述与标引难度增加;2、搜索引擎查全率高于查准率低。见搜索案例 5.1.2 元数据的定义(教材200) 是关于数据的数据,也是结构化的数据。 用于描述数据的内容(what)、覆盖范围(where, when)、质量、管理方式、数据的所有者(who)、数据的提供方式(how)等信息,是数据与数据用户之间的桥梁; 5.1.3元数据的功能 1、支持资源发现 2、组织数字信息资源 3、支持资源的互操作 4、支持数字识别 5、支持存档和保存 5.2 元数据的分类 5.2.1元数据有种类 对于元数据的种类有不同的分类方法。一般分为描述性元数据、管理型元数据、结构性 元数据、保存性元数据等等。 a) 描述性元数据(Intellectual Metadata),用来描述、发现和鉴别数字化信息对象,如 MARC、DC,它主要描述信息资源的主题和内容特征。 b) 结构性元数据(Structural Metadata),描述数字还信息资源的内部结构,如书目的 目录、章节、段落的特征。 c) 存取控制性元数据(Access Control Metadata),用来描述数字化信息资源能够被利 用的基本条件和期限,以及这些资源的知识产权特征和使用权限。 d) 评价性元数据(Critical Metadata),描述和管理数据在信息评价体系中的位置。 还可以分为管理性、描述性、保存性、技术性和实用性元数据。 5.2.2 从复杂程度分(教材202) 一级、二级、三级 5.3 元数据的结构 内容结构 句法结构 语义结构 5.4 都柏林核心元数据 1994 年在NACA 和OCLC 联合会议上由Stuart Weibel、Eric Miller 等提出的,后来由DCMI 负责维护的一种元数据标准。其基本方案是包括15 个“核心元素”的集合。 (参见教材207) 如何使用元数据? 元数据最基本的功能是通过数据元素集定义资源对象的各类属性,这些属性的大量实例 可以表达为关系型数据库中的表,或者以XML 等形式进行置标,从而能够利用数据库系统或各类应用软件进行管理。 元数据的置标 利用置标语言(例如HTML/XML/RDF/XMLs/RDFs/OWL 等)将元数据方案形式化, 提供机器处理的规范表达,就是元数据置标。 (参见教材211DC的应用) 5.5 MARC MARC是机器可读目录的简称。它是美国国会图书馆提出的著名的机读目录发展计划,于1964-1968年期间研制,1969年正式发行MARC磁带。目前大多数国家都是MARC的用户。我国1979年开始订购MARC,收藏于北京图书馆。 为了做到数据共享,必须将文献数据生成标准化的文档。没有文献数据的标准化,就没有文献管理的自动化。ISO 2709,即《文献工作——文献目录信息交换用磁带格式》是在MARCⅡ格式的基础上产生的。参考这一国际标准,我国于1982年制定了相应的国家标准,即《文献目录信息交换用磁带格式》(GB2901-82)。文献数据的标准化,就是参照有关的国际标准和国家标准,生成符合标准的文献数据文档。 中国机读目录CNMARC(教材228) 中国机读目录格式: 0---标识块 1---编码信息块 2---著录信息块 3---附注块 4---款目连接块 5---相关题目块 6---主题分析块 7---知识责任块 8---国际使用块 9---国内使用块 5.6其他元数据(略) 5.6.1 WETS 5.6.2 MODS 5.6.3 EAD 5.6.4 GILS 5.6.5 PICS 5.7 元数据的互操作有时间的互操作就是采用了不同的元数据方案的系统之间互相传输、共享和利用元数据的能力。主要是指元数据的数据格式、内容和语法的互操作能力。 元数据映射 利用特定转换程序对不同元数据元格式进行转换,称为元数据映射(Metadata Mapping/Crosswalking)。目前已有大量的转换程序存在,供若干流行元数据格式之间的转化, 例如 ?? Dublin Core 与USMARC; Dublin Core 与EAD ?? Dublin Core 与GILS; GILS 与MARC ?? TEI Header 与MARC FGDC 与MARC 也可利用一种中介格式对同一格式框架下的多种元数据格式进行转换,例如UNIverse 项目利用GRS 格式进行各种MARC 格式和其它记录格式的转换。格式映射转换准确、转换 效率较高。不过,这种方法在面对多种元数据格式并存的开放式环境中的应用效率明显受到限制
文档评论(0)