基于档案学角度对网络文件进行归档工作方法.docVIP

基于档案学角度对网络文件进行归档工作方法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于档案学角度对网络文件进行归档工作方法

基于档案学角度对网络文件进行归档工作方法    摘要:随着电子商务和电子政务的兴起,政府和企业以及其他机构纷纷建立自己的门户网站,将现实机构虚拟化,通过网站发布信息,提供服务,实现其管理和服务职能,极大地提高了办公效率,增强了办公的透明度。网站已经成为机构在网络空间开展业务活动的主要平台,网站开展业务活动的过程中形成许多具有原始记录性的电子文件,这些网站文件对于组织机构和人类社会来说都具有重大的意义。    关键词:档案学;网络文件;归案      网站文件是指组织机构在处理业务活动过程中,通过网站形成的、具有原始记录性的电子文件,包括网页、后台数据库文件、程序文件等。网站文件能够真实地反映出组织机构通过网站进行的业务活动的轨迹,具有凭证价值和情报价值。   一、网站文件归档的必要性   网站文件是社会活动中直接形成的原始性信息记录。对于组织机构来说,网站文件是组织机构在进行业务活动的过程中直接形成的原始记录,属于组织机构活动的证明。对于整个社会来说,网站文件是构成社会记忆的重要组成部分,是沟通历史的桥梁,具有历史性。但网站文件具有更新快、寿命短以及惟一性的特点,这就使得网站文件的保存必须要及时、可靠。   二、网站文件归档的可行性   就世界范围来看,由图书馆来承担的网页收集项目对网页的捕获、归档、存储都进行了研究,并在实践中取得了可喜的成绩,但是鉴定的角度不同,图书馆更加关注的是网页的文化价值,而忽视了其原始记录性,对于元数据捕获也没有给予足够的重视。笔者认为,网站文件归档的任务应当由档案部门来承担,档案学理论可以借鉴到网站文件归档中来。   1 电子文件管理对网站文件归档的借鉴意义。网站文件本身就属于电子文件的范畴,可以按照电子文件的管理方法进行管理,网站文件的生成、发布、捕获、归档、利用是一个完整的运动过程,应当对其全程控制,不仅保存网站文件本身,还要连同元数据、变化日志、插件程序等一起保存,才能保证网站文件的真实性和完整性。   2 来源原则对网站文件归档的借鉴意义。面对浩如烟海的网站文件,最好的方式就是以网站为单位进行保存,同一个网站的所有网站文件保存在一起构成该网站的“全宗”。网页与网页之间的链接关系和网页与程序文件的依附关系也不能被破坏。目前美国的互联网档案馆(Internet Archive)已经体现了“来源原则”。   3 档案鉴定理论对网站文件归档的指导作用。早在20世纪80年代,法国档案学者罗尔德#8226;瑙格勒提出了电子文件的“双重鉴定论”,一方面要判断电子文件信息的有用程度,另一方面要判断电子文件有用程度实现的可能。   4 档案部门理应承担网站文件归档的责任,由机构档案室对本机构网站包括内联网和外联网上的网站文件进行归档,公共档案馆对所有的公共网站上有价值的文件进行保存。   三、网站文件的归档策略   1 网站文件归档范围的确定   并非所有的文件都成为档案,同样,并非所有的网站文件都具有长期保存的价值,因而需要制定一个策略决定哪些需要归档,需要保存多长时间。   从内容上来看,有两种基本的收集方法:广泛收集法(comprehensive approach)和选择收集法(selective approach)。广泛收集法是通过自动捕获软件收集网络上的一切资源。选择收集法由人工进行鉴别有价值的文档然后再进行收集。   从技术上来看,应当归档的文件包括:系统软件、自动化软件的结构文件、日志、cookies、索引、图形、文本、出版物、图像、音频、视频。   2 网站文件的捕获策略   捕获策略取决于网站的类型和复杂程度,最常用的两种捕获方式是:对象驱动法(object driven strategy)和事件驱动法(event driven strategy)。适合于由HTML文件构成、不能实现交互功能的网站。事件驱动法主要是捕获网站和用户之间发生的事件或事务,适用于数据库驱动(database-driven)的动态网站。两种方法的最大不同就是着眼点不同,对象驱动法关注的是构成网站文件的对象,而事件驱动法关注的是网站和用户之间的单独的一个事件。   3 网站文件的保存策略   由于计算机软件和硬件的不断更新,今天还存在的电子文件十几年或几十年后未必能够读取。除了HTML文本文件属于非专利的形式外,网站上包含许多专利格式,例如,Java程序、ActiveX程序、.jpg格式文件、gif格式文件、.tiff格式文件等都是网站的构成要素,所以仅保存HTML文本文件是远远不够的。网站的内容、结构、背景都要保存,脚本程序(Script)和插件程序(plug-in)也需要保存,对于网站文件来说,元数据和数据同样重要。   四、网站文件归档存

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档