- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从档案学视角看网站文件的归档
随着电子商务和电子政务的兴起,政府 和企业以及其他机构纷纷建立自己的门户 网站,将现实机构虚拟化,通过网站发布信 息,提供服务,实现其管理和服务职能,极 大地提高了办公效率, 增强了办公的透明度。 网站已经成为机构在网络空间开展业务活 动的主要平台,网站开展业务活动的过程中 形成许多具有原始记录性的电子文件, 这些
网站文件对于组织机构和人类社会来说都 具有重大的意义。
网站文件是指组织机构在处理业务活 动过程中,通过网站形成的、具有原始记录 性的电子文件,包括网页、后台数据库文件、 程序文件等。网站文件能够真实地反映出组 织机构通过网站进行的业务活动的轨迹, 具
有凭证价值和情报价值。
一、网站文件归档的必要性
网站文件是社会活动中直接形成的原 始性信息记录。对于组织机构来说,网站文 件是组织机构在进行业务活动的过程中直 接形成的原始记录,属于组织机构活动的证 明。对于整个社会来说,网站文件是构成社 会记忆的重要组成部分, 是沟通历史的桥梁, 具有历史性。但网站文件具有更新快、寿命 短以及惟一性的特点, 这就使得网站文件的 保存必须要及时、可靠。
二、网站文件归档的可行性
就世界范围来看,由图书馆来承担的网 页收集项目对网页的捕获、归档、存储都进 行了研究,并在实践中取得了可喜的成绩, 但是鉴定的角度不同,图书馆更加关注的是 网页的文化价值,而忽视了其原始记录性, 对于元数据捕获也没有给予足够的重视。 笔
者认为,网站文件归档的任务应当由档案部 门来承担,档案学理论可以借鉴到网站文件 归档中来。
1、电子文件管理对网站文件归档的借 鉴意义。网站文件本身就属于电子文件的范 畴,可以按照电子文件的管理方法进行管理, 网站文件的生成、发布、捕获、归档、利用 是一个完整的运动过程, 应当对其全程控制, 不仅保存网站文件本身,还要连同元数据、 变化日志、插件程序等一起保存,才能保证 网站文件的真实性和完整性。
2、 来源原则对网站文件归档的借鉴意
义。面对浩如烟海的网站文件,最好的方式 就是以网站为单位进行保存, 同一个网站的
所有网站文件保存在一起构成该网站的
“全宗”。网页与网页之间的链接关系和网 页与程序文件的依附关系也不能被破坏。 目
前美国的互联网档案馆已经体现了 “来源 原则”。
3、 档案鉴定理论对网站文件归档的指
导作用。早在20世纪80年代,法国档案学 者罗尔德?瑙格勒提出了电子文件的“双 重鉴定论”①,一方面要判断电子文件信息 的有用程度,另一方面要判断电子文件有用 程度实现的可能。网站上的信息以多种格式 存在,并且具有多种表现形式,需要从技术 上判断其有用程度实现的可行性。对于网站 文件内容上的鉴定,可以借鉴加拿大档案学 者特里?库克的“宏观鉴定战略”, 从能否
反映该机构的职能,能否反映当时的社会环 境,能否满足人们的社会期望等角度进行鉴 定。
4、档案部门理应承担网站文件归档的 责任,由机构档案室对本机构网站包括内联 网和外联网上的网站文件进行归档, 公共档
案馆对所有的公共网站上有价值的文件进 行保存。
三、网站文件的归档策略
1、网站文件归档范围的确定
并非所有的文件都成为档案,同样,并 非所有的网站文件都具有长期保存的价值, 因而需要制定一个策略决定哪些需要归档, 需要保存多长时间。
从内容上来看,有两种基本的收集方法: 广泛收集法和选择收集法。广泛收集法是通 过自动捕获软件收集网络上的一切资源。② 选择收集法由人工进行鉴别有价值的文档 然后再进行收集。③。
从技术上来看,应当归档的文件包括: 系统软件、自动化软件的结构文件、日志、 cookies、索引、图形、文本、出版物、图 像、音频、视频。
2、网站文件的捕获策略
捕获策略取决于网站的类型和复杂程 度,最常用的两种捕获方式是:对象驱动法 和事件驱动法④。适合于由HTM顷:件构成、 不能实现交互功能的网站。事件驱动法主要 是捕获网站和用户之间发生的事件或事务, 适用于数据库驱动的动态网站。两种方法的 最大不同就是着眼点不同,对象驱动法关注 的是构成网站文件的对象,而事件驱动法关 注的是网站和用户之间的单独的一个事件。
以上两种方法讲的是什么元素需要捕 获,并没有说明捕获时间。捕获的时间取决 于网站变化的范围和频率。网站更新存在以 下四种情况:经常更新,更新间隔的时间是 三个月以内;不经常更新,更新间隔的时间 是三个月以上;有规律地更新,按照计划有 规律地进行变化;不规律地更新,没有按照 计划进行更新,更新时间比较随意,更新间 隔的时间也是不确定的。按照以上四种变化 情况,网站可以分成以下四种类型:规律且 经常更新的网站、规律但不常更新的网站、 不规律但经常更新的网站、既不规律也不经 常更新的网站。捕获网站文件的时间是由
原创力文档


文档评论(0)