档案数字化风险警示与对策.docxVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
档案数字化的风险警示与对策 谈胜祥 近年来档案数字化工作在各级档案馆广泛地展开,数字化的含义就是将传统档案、资料的目录和全文转换成计算机网络中的数据,这些数据包含了各种门类档案目录信息和全文信息。数字化产生的数据也就是数字化成果,是建立档案信息资源的基础工作,在这个基础上,档案信息资源才能得以深度开发和利用。 各级档案馆全面开展数字化工作产生的巨量数据,绝大部分是扫描电子文件,存在着长期有效保存的问题。扫描电子文件也是一种机读文件,必须依赖相应的软硬件设备。然而,计算机技术的飞速发展使得电子文件依赖的机读环境也在不断变化。如果没有一定的技术力量和信息管理机制的支撑,巨量数据将面临着技术风险和管理风险,随时有可能造成数据丢失或者数据报废。深刻认识这些风险并采取避难对策,才能真正保住投入了大量人力、物力的数字化成果。 一、脱机载体长久保存的技术风险 目前档案馆数字化工作一般都委托给专业公司,数字化以后的扫描件一是挂接到应用系统的数据存放区域,二是刻录到光盘作为数字化工程完成的交付物。由于数据量很大,交付的光盘数量也巨大,一般都要上千张,加之有的档案馆为了保险起见,往往要求专业公司刻录三套甚至四套备份盘,这对档案馆而言实际上增加了管理负担。因为存放的光盘不仅仅是立放在库房的柜子里就相安无事,而是定期需要进行可读性检测,长期没有检测的光盘是不能保证光盘中的数据是否可读,而光盘检测又是一件费时、费力的工作。 回顾档案信息化进程中的数据丢失案例,对于当前正在大规模进行数字化的档案馆是一个很好的风险警示。从过去的失败中获取经验教训,避免重蹈覆辙。 上世纪九十年代,上海一些区县档案馆开始了数字化扫描工作,采用了某一知名公司的软件和设备,投入了一定的人力、物力。最终这批扫描件基本废弃,因文件命名规则与数据库结构问题无法与后面开发的档案管理系统挂接,所以无法检索、利用。而原有的检索系统又存在一些缺陷,已经不适应新的计算机软硬件环境而不得不淘汰。 同时,上海一些企事业系统要求财会电算化的数据向档案室移交、归档。当时使用的是五英寸和三英寸软盘,这些存放财会电算化数据的软盘随着计算机设备和财务软件更新而全部淘汰,里面的数据也没有机会进行迁移。此外有的档案馆接收了统计部门或其他部门存放在软盘中的人口普查资料和其他业务数据,最终因为软盘的淘汰而造成数据全部丢失。之后存放在光盘或者磁光盘的移交数据也因为软件和硬件技术的升级而无法机读。这些案例一再说明了采用脱机载体长期保存数据会遇上技术风险,这种技术风险就是计算机软硬件发展的一个隔代不兼容性问题。 虽然在电子文件保存和光盘载体管理出台了一系列的标准,但是有一个无法回避的问题,档案馆开展数字化加工的档案其保管期限一般都在三十年以上,相应的扫描件如何通过脱机载体存放这么长期限是一个未知数。对于三十年以后的计算机设备是什么状况谁也无法预测,鉴于前三十年的发展过程,这些存放巨量信息的载体在三十年内被彻底淘汰是大概率事件。如果用静止的思维去制定电子文件载体保管措施,似乎像刻舟求剑?当然有不少人提出用迁移的方法解决技术更新带来的不兼容问题,但是否有人真正考量过迁移的成本和操作性。至少目前很多档案馆经过数字化后,一是迁移量很大,数据的增量都达到TB级别。二是数据结构和数据格式并不统一,这些数据相互之间都有一定的关联,例如目录信息与全文信息不在同一数据库中,而是通过标识符连接。再由于全文信息的格式很多,在原来生存的操作系统、数据库环境中实施数据从光盘或移动载体中导入到服务器与应用系统连接,有时难免出错。如果硬件设备完全更新、操作系统和数据库也同时升级更新,原数据可能要进行格式转换,迁移的出错风险也会更高。 因计算机技术发展引发的脱机载体的数据无效保存风险还只是一种技术风险,从现在很多领域的实际应用中,这种技术风险是可以避免的,但投入的成本也很高,需要思考的是这种高成本的数据保存方式是否适合目前各个综合性档案馆各自为阵的保管模式。 二、档案馆计算机机房及信息系统正常运行的管理风险 档案馆计算机机房的各项设备;包括应用服务器、数据服务器、数据备份设备、网络交换机、不间断电源、空调设备以及各类安全设施的正常运转,才能保障档案信息系统的正常运行。 随着数字化工作的快速推进,档案馆数据量的急剧增大,一方面档案查询效率不断提高,另一方面管理风险也不断增加。为了合理部署数据存储设备和安全因素,档案馆的信息资源的存放有在线、近线和离线三种方式,同时又不时有新增数据导入和离线数据导出。这种数据操作有的通过程序驱动相应设备自动完成,有的依靠机房管理人员手动操作。无论自动还是手动操作数据,在缺乏校验机制的情况下,数据出错的风险依然存在。 计算机机房的设备管理和数据管理,一是需要管理人员具备相应的技术能力,二是责任心,三是管理措施保障。 现行机房

文档评论(0)

kfcel5889 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档