- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
                        查看更多
                        
                    
                Web Archive保存研究现状意义和发展策略
                    Web Archive保存研究现状意义和发展策略
    摘 要:分析了WebArchive保存问题的国内外研究现状,阐述了研究的意义并提出了相应的发展策略。 
  关键词:Web Archive;现状;意义;发展策略 
   
  类似经历应该不会感到陌生:打开一个URL,网页上显示――The pase can-not be found或The Servicc Invalid.ablc。巨量的web Anhive在不断地增加的同时,一边也在不断地消失,按照Ntoulas等人的研究,网页每周以8%的速度在更新之中,即每周大约有3.2亿个新网页产生,数据量相当于3.8TB,网页之间的链接关系也在不断地发生着变化,每周大约新产生25%的新链接:而根据另一项研究r2)则表明,一个Web Archive的平均寿命只有44天。 
  Web Archive作为全球最大的信息资源库,存在着大量对文化遗产、学术研究、社会经济与政治具有重要价值的信息,但其产生的“自发性”与存在的“流逝性”的双重特点,使其成为一种珍贵而又脆弱的信息资源。而设置各种馆库选派专人进行管理各个时期所形成的档案信息资源,这是人类自古以来就形成的惯例,在网络环境下也不例外。因此,如何保存并让其成为后世不可缺少的智慧遗产,就成为当今人类社会信息管理中越来越重要的课题与研究领域。 
   
  1 研究现状 
   
  1996年,互联网档案馆(The Internet Archive)产生,标志着人类对web Archive保存研究的开始,它是一个非赢利性的WebArchive数据库,面向全球用户,免费、公开其收集的全部WebArchive信息资料;同年,澳大利亚国家图书馆开展了名为PANDO-RA项目,其主要是保存该国的在线出版物:同年,瑞典成立了Kulturarw3的web信息资源采集项目;2000年,美国国会图书馆提出了NDIIPP计划,webArchive作为其六个收集范围中的主要组成部分;2003年,由12个成员机构发起的国际网络保存联盟IIPC正式成立,其成立的目标就是:保存来自全球的web Archivc内容,使其能够持续地提供访问。到2008年,该联盟已吸纳了37个成员机构,其中也包括亚洲的日本。各种相关项目还在不断地出现,其研究的内容与深度在不断地拓展,并且,已开始将成果转化到实际应用和商业化操作的服务模式,如Hanzo Archive公司提供为企业级存档服务以及商业化服务应用(Archive-it)。 
  相对于国外而言,我国的研究要晚些,中国“Web信息博物馆”自2002年1月18日第一次搜集以来,已保存了30多亿页的中文Web资源:国家图书馆“网络信息采集与保存”项目,保存了自2003年以来.cn域名下的网站和所有中文网站的Web信息。 
   
  2 研究意义 
   
  网站已经成为机构在网络空间开展业务活动的主要平台,根据CNNIC2008年发布的《中国互联网络发展状况统计报告》,中国网站数量已达到1919000个。WebArchive中存在着大量的具有原始记录性的信息资源,其对于组织机构本身与社会来说都具有保存的意义。 
   
  2.1 Web Archive保存是网站复原的保障。网站复原也就是使保存起来的网页内容以原来的样貌呈现给用户,这其中包括其链接。比如,现在您想看看2000年时的新浪网站是个什么样子,上面有哪些信息?那么它将完整地展现在您的眼前,就犹如在访问原始网站一样。在这个意义层面,百度做得比较成功,它考虑到某些网站提供的信息可能由于内容更新或更换URL地址而无法显示,百度将搜索到的绝大部分内容都存放在自己的中,即百度快照,当原始的链接无效时,用户可以通过它查找到相应的信息,从而满足用户的信息需求。 
   
  2.2 Web Archive保存保证了社会记忆的完整性,网页信息资源同样也是社会活动中直接形成的原始性信息记录,就如同我们所有的社会活动形成的原始记录一样,它准确地反映了我们的社会现实,如网络日志、博客(Blog),等等,它就犹如传统意义上的日志一样,成为个体的社会关系、日常活动等各种资源的汇聚节点。在网络环境下信息来源、自主跟踪关键字,以“自我”为中心,把最快、最高价值的信息聚合起来,实现所有互联网信息的“一站式”阅读体验,这种全新的社会记忆方式,充分反映了信息技术发展给人们间交流带来的便利。另一方面,对于组织机构来说,网页信息是组织机构业务活动过程的最直接证明。对于整个社会来说,网页信息更是构成社会记忆不可缺少的组成部分,是沟通历史的桥梁。数字文化遗产概念的兴起其实也是充分地反映了人们对这个问题的重要性有了进一步的认识。 
   
  2.3 Web Archive保存是研究Web及相关技术发展的最有
                您可能关注的文档
最近下载
- CSP_IPD_PSSD_T_0199概念决策评审点(CDCP)财务代表输出模板_V2.1.xls
- 2024年中国联通内蒙古分公司招聘真题.docx VIP
- 新目标大学英语(第二版)视听说教程 1 参考答案.pdf VIP
- 《HG_T 3796.10 - 2006螺杆式搅拌器》最新解读.docx VIP
- 江苏开放大学《行政管理学》第三次作业 答案.docx VIP
- 2025年军队文职统一考试《专业科目》数学真题及答案.pdf VIP
- 妇产科学复习重点笔记.doc VIP
- 八年级家长会PPT课件模板.pptx
- 茶语春秋—中国茶文化 智慧树 知到答案.docx VIP
- 工程设计项目控制程序.doc VIP
 原创力文档
原创力文档 
                        

文档评论(0)