引言 现在人们已经进入网络时代,人们查询信息.docVIP

引言 现在人们已经进入网络时代,人们查询信息.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
引言 现在人们已经进入网络时代,人们查询信息.doc

  引言 现在人们已经进入网络时代,人们查询信息 引言      现在人们已经进入网络时代,人们查询信息的手段越来越趋向于网络化,然而网络信息的提供者只注重信息的内容,而忽视了网络信息资源的描述问题。这使得搜索引擎无法提取网络信息资源的核心内容,从而导致查全率和查准率低。一种现象随之产生,即在互联网上总能找到(甚至只能找到)不需要的东西。网络信息资源被准确而合理的描述是其被有效利用的前提和基础,尤其对庞大的网上资源而言。因此,只有对网上的信息资源进行整体上的有效组织、管理和个体上的充分揭示和描述,才能从根本上解决查找、利用上的困难,提高查全率和查准率。但是,网上的信息资源不同于传统的文献资源的各种特点,要求创立有别于传统书目著录组织方式的新工具——元数据,就在这一背景下产生了。   元数据,即关于数据的数据,用来描述网络信息资源、加强对网上信息资源的组织和利用的网络数据集合。而都柏林核心元数据集(Dublin Core Element Set,简称DC)是其中发展比较成熟而又比较成功的一种元数据。DC 元数据计划的创建,是通过网络信息资源的提供者对资源属性信息的描述,并对其内容进行编目、定位,来帮助人们尽快地在网上发现所需要的有效信息资源。因此,DC 元数据资源描述方案又称为网上资源的编目。      1 DC 元数据的发展和规范      1995 年3 月由OCLC ( Online puter Library Center)和NCSC(National Center for Superputing Application)在美国俄亥俄州的都柏林镇联合召开了第一届DC 元数据研讨会,目的是寻求一套见解有弹性、非专业图书馆人员也可轻易掌握和使用的信息资源著录格式,以提高网络信息资源的开发利用率。会议结果产生了13 个元数据项,因为开会地点在柏林,因此成为柏林核心集,简称DC。1995 年至今,OCLC 与各有关机构联合举行了8 次DC 研讨会,每一次研讨会都推出一些具体的研究成果,1996 年9 月24 日~25 日,第三届元数据研讨会将原有的13 个元数据项扩充为15 个,1999 年12 月22 日,经过第七次会议讨论,形成了DC 修饰词1.0 工作方案,经过几年的研究探讨,DC 被译成25 种语言,并被许多纳入中,成为描述电子信息的一个部分。因此DC 的影响正逐步扩大,有望在不久的将来成为各国都能接受的国际标准[1]。 ( lw.AsEac.编辑整理)   DC 是在网络环境中描述文件类对象所需要的最小元素集。其中15 个元数据项可以分为[2]:   (1)Title:标题项,由资源或出版者给出的被描述资源的名称。   (2)Subject:主题词或关键词项,一般是描述资源的主题和内容的关键词或短语。   (3)Description:描述项,资源的文本描述,包括文献类对象的文摘或视频的内容描述。   (4)Source:项,用来唯一标识被描述资源的。若当前的资源为其原始形式,项元素可以不用。   (5)Language:语言项,被描述资源内容的描述语言。   (6)Relation:关联项,被描述资源与其他资源之间的关系。   (7)Coverage:时空范围项,被描述资源空间或时间特性。空间范围物理区域,来自规范词表的地名或全称。时间范围指资源内容,而不是资源产生的时间(由日期Date 元素表示)。时间描述采用与日期Date 相同的格式或者采用规范列表中的时间范围描述。   (8)Creator:或者创建者项,对创造资源知识内容负主要责任的个人或机构。   (9)Publisher:出版者项,负责发行被描述资源的组织。   (10)Contributor:其他参与者项,指没有在Creator 元素中列出的对被描述资源的创作做出了共献的其他人或组织,其贡献次于创建者。   (11)Rights:版权管理项,被描述资源的版权声明和使用范围。   (12) Date:发布日期项,被描述资源公开发布的日期。   (13)Type:类型项,被描述资源属性的范畴或类型,通常从资源类型列表中选取。   (14)Format:格式项,被描述资源的数据格式,用于注明需要什么软件或硬件来显示和执行这一资源。为了提高互操作性,格式值应该从格式列表中选取。   (15)Identifier:标识项,能够唯一标识描述资源的字符或数字。   这简单的 15 个元素由于具有可延伸性、可选择性和可重复性等特点,可根据不同行业的需求对其进行改编,达到描述信息的完整性、可靠性和检索效率高的目标。从DC 元数据的元素结构及著录规则可以看出有如下特点:   (1)结构简单。只有15 个基本元素,且根据DC 的可选择原则,还可进一步简化著录项目。   (

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档