美国国会图书馆和网络档案Web 存储成果概览.docVIP

美国国会图书馆和网络档案Web 存储成果概览.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
美国国会图书馆和网络档案的Web存储成果概览 许宏伟 曲阜师范大学数学系 山东 曲阜 273165 [摘要] 本文简要介绍了美国国会图书馆的Web存储项目MINERVA和致力于Web存储的组织网络档案(IA)在Web存储方面的做法及取得的成果。 [关键词] Web存储 美国国会图书馆 MINERVA 网络档案 A General Picture on Web Archive of the Library of Congress and Internet Archive Xu Hongwei Department of Mathematics, Qufu Normal University, Qufu, Shandong 273165 [Abstract] This paper introduces the web archive results of the Library of Congress and Internet Archive and gives a brief introduction of their rules of archiving. [Keywords] Web Archive; Library of Congress; MINERVA; Internet Archive 为存储脆弱易失的Web信息,美国国会图书馆启动了名为MINERVA的 Web存储项目。美国的网络档案(Internet Archive)于1996年开始存储行动,目前拥有世界上最多的Web存储成果,为留住人类网络文明的历史做出了积极贡献。 1 国会图书馆的Web存储[1] 1.1 MINERVA项目简介 MINERVA(Mapping the INternet Electronic Resources Virtual Archive)是美国国会图书馆的Web存储项目。2000年,美国国会批准国会图书馆承担国家数字信息基础设施和保存项目(NDIIPP,National Digital Information Infrastructure and Preservation Program),该项目旨在保存有极大丢失危险的数字文化信息,国会图书馆承担了项目的领导角色。2003年国会图书馆发布了项目通告,开始创建合作伙伴关系,合作伙伴之间采用相同的技术框架,分享相应的项目资金,前3年合作者可以得到50万美元到300万美元不等的项目经费,申请参与的组织必须提供与项目经费相对应的建设资源。最初他们组建了八个项目合作组,每个小组根据自身的强项获得项目任务,每个项目组有领导单位、参与者和合作伙伴组成,项目组成员有图书馆、计算机中心、软件公司等。国会图书馆对合作伙伴的工作提出目标性的建议,建议他们采取用户调查的方式,确定要永久性存储内容的历史重要性以及研究人员的兴趣等;评估要存储的内容是否处于丢失的危险边缘,同时还要评估这些信息是否有长期存储的价值;还要求参与者确定所承担项目部分的存储目标,譬如,Web、流媒体、GIS资料、互动内容等[2]。 1.2 国会图书馆的存储的原则、采集方式和元数据描述框架MODS 国会图书馆的存储原则是:对确定需要存储的内容进行专题存储,其中包括重特大事件、面向主题内容、按领域(例如:gov.、edu.)进行存储。采集工作由网络机器人完成。 为了有利于图书馆对Web存储内容的管理,方便访客的访问,国会图书馆的“网络发展和MARC标准”办公室组织研发了特别适用于复杂数字资源存储与访问的元数据描述框架MODS(Metadata Object Description Schema )。根据“网络发展和MARC标准”办公室的工作人员Rebecca Guenther介绍,MODS有以下特点[3]:MODS用XML语言编写,有较好的随意性和灵活性;由MARC派生而来,与MARC的元素定义相同;可以重新包装MARC格式下的数据,有些MARC格式下的多个数据在MODS中被包装为一个。然而,MODS并不能与MARC21全部对应,也就是说,一个原来为MARC21的记录转换为MODS之后,再由MODS转换回MARC21时会丢失标识的细节或丢失数据,但核心元素不会丢失;第二种可能发生的情况是由MODS转换回MARC21时,数据可能不被精确地返回到它原来的位置,然而核心数据不会丢失;第三种情况是在MARC中的元素在MODS中没有相对应的元素,这些数据在转换成MODS时有丢失的可能。MODS共有18个核心元素,其元素集比Dublin Core 的15个元素丰富,但比MARC 简单。在其MINERVA存储的专题中采用了题名、摘要、时间(采集时间)、来源(网址)、语言等10个核心元素。 1.3 已供访问的存

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档