第五章信息组织元数据课件.ppt

  1. 1、本文档共108页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一节 元数据概述 元数据由来 元数据定义 元数据功能 元数据的定义 我们所说的“元数据”,英文作Metadata。目前在国内有多种译法,大陆一般译作“元数据”。香港和台湾则译法较多,台湾有人译作“预设资料” 、“诠释资料”、“元资料”,也有人译作“后设资料”。 关于这一名称,西方学者大多定义为:Data about Data,即关于数据的数据。它是用于描述信息资源的高度结构化数据。 数据是手提箱,而元数据是它上面的姓名标牌;数据是文件夹,而元数据是夹子的标签;数据是书的内容,元数据是书脊上的杜威十进制数码。 第二节 元数据的分类 一、按功能分 管理性 描述性 技术性 保存性 使用性 第二节 元数据的分类 二、按复杂程度分 采用简单的记录格式 结构化的格式 复杂格式 第二节 元数据的分类 三、按描述的资源类型分 采用简单的记录格式 结构化的格式 复杂格式 元数据的结构 内容结构 句法结构 语义结构 都柏林核心元数据 一、DC概述 二、DC定义 DC核心元素集参考描述如表: 资源名 创建者 MARC及Dublic(DC) MARC于1965年由美国会图书馆一个研究小组制定,后来不断完善,成为图书馆数字化检索的重要格式。1991年,我国有关部门在UNIMARC基础上加上我们所需的特定字段,编制了《中国机读目录通讯格式》(CNMARC),此后多次修订 Dublic Core 最初于1995年制定,从时间上看要比MARC晚,在技术上要先进 Dublic Core (DC) 由来:在1995年联合召开了第一次都柏林(都柏林为美国俄亥俄州的一个城市)核心集会议。来自图书馆、计算机及有关领域的专家达成一致意见,创建了只包含能够描述电子文献基本特征的Dublin Core 从1995年开始,专家小组共召开了13次会议,讨论与核心集相关的各种问题。2004年10月11-14日,我国上海图书馆主办了第12次会议。最近一次会议于2005年9月12 -15日在西班牙首都马德里召开,来自33个国家和地区共计214名专家学者出席了会议。 Dublic Core的原则 简单性原则”。定义一个能得到最广泛应用、被全球所理解和接受的最小元素集,并能作为特殊用户详细描述需求的一个核心集。 “易用性原则”。能方便作者和信息提供者描述自己的文档,而不给他们增加太多的负担,并能方便地实现资源发现工具之间的互操作性。 “内在性(intrinsicality)原则”。指DC 元数据以揭示描述对象自身的内容属性为主,外部属性为辅。 “可扩展性原则”。希望DC 成为一个“核心”元素集合而可以通过各种方式扩展为适应各领域资源描述需要的元数据方案。 “句法独立(syntax independence)原则”。指DC 元数据的元素可以以多种方式编码,应用于各类技术平台中。DC 只规定元素的基本语义。 “可选择性”。指DC 元素集合中的任何元素都是可选的。 “可重复性”。指DC 元素集合中的任何元素都是可重复的。 “可修改性”。指在具体应用中可以对DC 元素集中的任何元素进行进一步“修饰”或“限定”,但不能扩大或改变元素的基本语义。 元素:标题、作者、主题、出版者、描述、其他参与者、日期、类型、格式、标识、关系、资料来源、语言、内容范围、版权15个元素组成 都柏林核心集目前已经扩展成一个世界性元数据标准,有五个国家(澳大利亚、芬兰、丹麦、英国、美国)把它确定为国家标准,各类推荐方案被翻译成33种语言。 当前对都柏林数据集的看法 由于Google等检索工具出现,一些人甚至断言,元数据特别是DC,在还没有成为通用标准以前,已经寿终正寝了。 Google等通用检索工具,查全查准两方面都还有很多问题。 而在这两个方面,使用元数据的专用信息库则会充分发挥自己的优势。 在今后的一段时间内,元数据不会因为信息技术的进步而失去其存在的价值。这是我们断续研究和使用元数据的最主要的动力。 DC分为两类:基本DC和限定DC 语种描述 模式体系 属性类型 机读目录(Machine Readable Catalogue,MARC)是一种以代码形式特定结构记录在存储载体上,可由特种机器及计算机阅读、控制、处理和编辑输出的目录格式。 机读目录的发展简史 美国。LC在世界图书馆界率先开展了计算机在图书馆编目技术上的应用研究。1964年LC提出了著名的“马尔克计划”,即以机器可读形式记录图书馆的书目记录,从而开创了文献资源信息描述的新阶段。 美国 LC运用集中编目的思想,一开始就把机读目录的研制方向确定为向全国发行机读目录磁带,便于共享。 1966年2月开始实施MARC试验计划,11月完成MARCⅠ机读目录格式并生产出试验性磁带,称为“MARCⅠ”磁带。 美国 1967年对MARCⅠ进行改

文档评论(0)

daoxbiviy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档