网络信息采集与保存标准规范研究.pdf

网络信息采集与保存标准规范研究.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络信息采集与保存标准规范研究

本期话题 http: // 网络信息采集与保存标准规范研究* □ 曲云鹏 王志庚 李春明 周晨 李成文 / 中国国家图书馆 北京 100081 摘要:标准规范体系研究是网络信息资源保存方法研究中重要的领域之一,是保证网络信息资源 保存工作顺利进行的基础。网络信息资源的特点决定了现有的数字资源长期保存标准并不完全适用。 文章通过对相关领域进行研究,从两个角度对网络信息采集与保存标准规范进行分析与组织,提出了 网络信息采集与保存标准规范体系,并在文章结尾阐述了网络信息采集当前面临的困难。该文为2009 年第七期“网络信息资源保存”专题文章之一。 关键词:网络信息资源,标准规范 DOI:10.3772/j.issn.1673—2286.2009.07.006 1 前言 生保证了网络信息资源保存过程具有期望特性,例如 质量、环境友好度、安全、可靠、高效等等。标准规 网络信息资源保存 (Web Archiving,简称WA )所 范体系研究是网络信息资源保存方法研究中重要的领 解决的问题就是如何来选择、采集、标引、保存和访 域之一,是保证网络信息资源保存工作顺利进行的基 问生命短暂的网络信息,一般的方法是首先通过工具 础。因此,建立一个WA标准规范体系对解决WA领域 对互联网进行采集并保存,然后通过采集选择域或者 的各个技术难题具有很重要的意义。 网站来建立一个代理,在现在和将来可以通过该代理 网络信息资源采集与保存 (Web Archive ,简称 [1] 来对所保存的资源进行访问 。 WA )是近几年刚刚兴起的研究领域,其应用范围、工 网络资源是一类比较特殊的数字资源,因此WA 作流程等仍然没有确定的结果,很多WA项 目都在参考 属于数字资源长期保存范畴。数字资源的长期保存包 数字资源长期保存领域的各种规范,而事实上,数字 括规划、资源分配以及保存策略和技术的运用以确保 资源长期保存领域的规范并不一定适用于WA领域, 那些具有长久价值的数字信息可以被永久访问和持续 WA系统需要制定更多更详细的标准规范来保证工作的 利用的过程。数字资源的长期保存涉及到一系列的信 正常准确的运行。 息记录活动,保存的目的在于实现数字资源的五项功 能:即可用性、可表现性、可理解性、真实性和可识 2 IIPC对于网络信息采集与保存标准 别性。WA也有着同样的目标。通用的标准规范体系可 规范的研究成果 以为WA 目标的实现提供理论基础。 在WA过程中,标准规范包括资源存档格式和元数 IIPC (International Internet Preservation Consortium, 据应用框架,涉及到网络信息资源及其保存过程的整 国际互联网保存协会)是较早建立的专门研究WA领 个生命周期,是保存活动中非常关键的部分。标准化 域问题的组织之一,为实现网络信息资源保存 目标作 对网络信息资源保存过程的影响是巨大的,标准的产 了大量的工作,其中也包括他们对标准规范领域所做 * 本文系国家社会科学基金项目“网络信息资源保存的理论与方法研究”(项目编号:06BTQ025)的研究成果之一。 年第 期(总第 期)

您可能关注的文档

文档评论(0)

yanmei520 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档