- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电子文件长期保存格式探析的论文.doc
电子文件长期保存格式探析的论文
电子文件格式是指将信息以某种格式进行编码,而且只有依靠特定组合的软硬件方能对文件实施读写操作。随着信息化建设的发展,已有的电子文件格式很多,新的格式也不断产生。因此,为了确保电子文件的长期存取,档案部门作为永久保存电子文件的基地,应采取各种措施积极应对这种挑战。
一、电子文件内容、形式及常见的格式
电子文件是指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件。它主要包括电子文书、电子信件、电子报表、电子图纸等等。按载体划分,可以把电子文件分为光盘文件、硬盘文件、软盘文件和磁带文件;以数据的表现形式为划分标准,有字符文件、表格文件、图文混排文件、数据库文件、图形文件、动态影像文件与声音文件等;以属性为划分标准,数据库文件又有foxbase(动态数据基地)数据库、foxpro(“京通”软件应用的)数据库、access(通路)数据库、orcal(“灵通”软件应用的)数据库等。
按电子文件的格式划分,有数字文本文件 、数字影像文件、数字图形文件、数字语音文件、数字视频文件。文本文件常见格式有xml、txt、uof、rtf、p3、a、ogg vorbis 、flac;视频文件常见格式有avi、mov、mpeg等。.
二、电子文件长期保存格式选择存在的问题
选择专用媒体或是专用存储格式将来会导致数字存储问题,例如媒体格式。选择专用媒体格式存储电子文件,必须考虑将来该格式的过时问题。再例如文件格式。为了确保电子文件的长期存取,如果采用专用的文件格式,会由此增添更大的复杂性。专用软件的应用常常升级至最新版本,然而软件的功能却没有像版本变化那么明显。随着时间的过去,文件格式累积的变化更为显著,甚至危及格式逆兼容。对遗产软件的维护显得很急迫,但是存在的问题颇多。就像应用软件一样,操作系统也得定期升级,随着系统基本体系结构的发展,将来不再支持遗产软件,不对遗产软件支持就意味着产生新的安全问题的风险也在增加。
三、电子文件长期保存格式的选择标准
1、按格式种类分析
要作为文本型电子文件的归档格式,马春茂①认为应该符合下列条件:(1)应该是公开的格式,不依赖特定的系统和软件存在,能够在可以预见的时间内被正常读取;(2)应该保持文件生成时的排版格式,即使经过办公软件的不断升级,也能输出同纸质文件一样的格式;(3)应该便于数据交换、便于查找和检索;(4)应能保证电子文件在处理过程中不被篡改和窃取。
为了对数字资源实施长期保存,对保存图像格式的选择尤其重要。叶新民②认为应满足格式使用的标准化和广泛性;格式应是公开的,而非私有的,而且应公开已出版的技术资料;格式应支持元数据;格式应对存储介质无依赖性等要求。
对于数码录音的电子文件长期保存格式,张文浩③认为应支持真实性验证技术、数码音质无损、文件格式开放透明、不绑定软硬件、格式自描述、格式自包含、易于存储、格式紧凑、信息安全、代价最小等要求。
数字摄像(dv) 、数字电视(dtv) 和网络视频系统的广泛应用以及对现有模拟视频的数字化, 视频电子文件的数量和类型不断丰富。项文新等④提出从保证视频文件的原真性和档案保管利用的便捷性出发选择合适的视频电子文件归档格式,认为视频电子文件应尽可能保证视频文件的原真性。
2、综合性分析
对于长期保存人类文化遗产的档案馆、图书馆, 最关心的是数字信息的内容不得丢失。刘家真⑤针对电子文件保存格式的选择问题,认为该格式能在不同的环境下使用;应是通用的、非专用的格式;支持数据从专用格式的环境中移出;最好是标准格式;被业界或用户广泛支持;具有可扩展性;可真实完整地被用户读出并理解, 无论何时何地, 用户所查到的该文件信息都与该文件最初情况完全一致;具有自身的可证明性;具有可评价性。
档案是历史的真实记录,具有凭证价值与情报价值。李泽锋⑥认为档案数字化过程中选用电子文件格式应考虑:保持档案原貌,利于网络平台下的传输交流,具有一定的标准性,具有较好的通用性和可移植性,选用电子格式的支持软件应支持数据从专用格式中方便地移出。
为了应对电子文件长期保存的需求,adrian broac等任一系统平台上原版原式地读取pdf文档,不受操作系统、网络环境、应用程序的版本、字体的限制,从而从电子文件自身的角度保证了电子文件的可读性。pdf格式所具有的高度兼容性使用户可以轻松地将任何文档原版原式地转换成pdf文档,进而固化信息,使之不易更改,保持了原文档信息内容和结构的完整、真实,为不同软件生成的电子文件提供了一个可完整迁移其信息内容的统一文件格式。pd
文档评论(0)