- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
档案数字化与存储格式比较研究
档案数字化扫描与存储格式比较研究 收藏
作者:傅荣校,翁敏曦作者:傅荣校,翁敏曦
一、引言
档案数字化是指“利用数据库技术、数据压缩技术、高速扫描技术等技术手段,将纸质文件、声像文件等传统介质的文件和已归档保存的电子档案,系统组织成具有有序结构的档案信息库。”①档案的数字化可以节省档案存贮空间,缓解库房压力,也可以减少因对档案原件频繁使用而造成的磨损,妥善解决珍贵档案文献的利用问题,有利于保护档案原件,尤其是珍贵档案的保存。目前,数字化在档案事业中发挥着重要的作用,已成为档案工作发展的必然趋势。
二、档案数字化与扫描技术
档案数字化实现文本的输入,主要是采用扫描方式将纸质的文件与档案转换为数字化的形式。扫描加工是通过中高速扫描仪和专用扫描软件将整理和分检好的档案资料批量转化成图像文件,并自动实现图像压缩存储的过程。
(一)国家规范中的有关标准
档案数字化直接标准除《电子文件归档与管理规范》外,就是《纸质档案数字化技术规范》。这一技术规范指出,“扫描应该根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。”另外,“纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。”②
扫描色彩模式一般有黑白二值、灰度、彩色等,通常采用的是黑白二值。具体又细分为三种:“页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。”③
扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。因为高分辨率容易使文件遭到复制,基于此,国家规范中规定采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均选择≥100dpi。如遇到文字偏小、密集、清晰度较差等特殊状况,则可以适当提高分辨率。而需要进行OCR汉字识别的档案,扫描分辨率一般建议选择≥200dpi。
(二)实际操作中的做法
实际工作中,档案部门根据档案本身不同情况,一般都采用各类扫描仪进行扫描,数码相机则较少使用。另外,实际扫描中受档案状况或扫描设备所限,也存有一些暂时无法进行数字化转换的档案,如纸张过于破损、发脆,或者某些尺寸过大的图纸等。而这些只能等待设备或者技术的更进后才可以解决。
色彩模式的选择是依据现有的设备以及档案本身状况而定的,可以遵守循序渐进的原则。比如杭州市档案馆在进行纸质档案数字化时,一期以黑白扫描为主,二期对红头文件及其他带有红章的文件进行彩色扫描,三期则全部进行彩色扫描。无疑,彩色扫描的层次更加丰富,清晰度更高,可以更真实地显示档案原貌。
分辨率的选择与设备关系很大,在不同地区、不同部门也有所差别。如杭州市档案馆在纸质档案数字化的一期工程中,就将扫描分辨率定为300dpi,浙江省档案馆的数字化扫描分辨率一般在200~300dpi左右,有的高达600dpi;而在一些设备相对比较落后的部门与地区,其扫描分辨率大都是按照国家规范来设定的,甚至于很多部门还达不到200dpi。分辨率越高,扫描后的图像就越清晰,但同时必须考虑到图像文件的大小。
(三)扫描技术发展趋势
扫描技术中最主要的是色彩模式选择和分辨率选择。
色彩模式无疑会朝着彩色扫描发展,而分辨率的选择需要根据实际业务进行灵活设置。一般情况下,为了满足网络化查询利用,黑白图像采用200dpi就可以满足要求,彩色图像的扫描分辨率还可以低一些,具体参数可以根据扫描清晰度和质量因素进行综合选择。对于一些特殊的利用如承办展览等可以采用较高的扫描分辨率来进行。值得注意的是,分辨率的选择既不可过低,也不可过高。如福建曾采用了50dpi的扫描分辨率,虽然容量小、费用低,但是根本无法实现上网查询利用,等于做了无用功;另一方面,如果一味追求过高的分辨率,则会导致容量过大,对于网上资源的传播也是一种负担。
档案数字化后还要考虑文字识别(OCR)的运用,一般来说,文字识别主要用于全文检索之用,而非真正将扫描后的图像文件还原为文档,因而,就这一点看,不要以OCR的识别率来设置扫描分辨率,《纸质档案数字化技术规范》建议需要OCR识别的图像文件,分辨率≥200dpi,这是一个比较中性的标准。
三、数字档案的存储格式
(一)文档数据的存储
如何在数字化过程中将馆藏档案统一转变为某些具有国际或
您可能关注的文档
- 校本课程开发背景进展及现状徐玉珍.pdf
- 核电厂操作员职业适宜性心理素质评价测试指标研究.pdf
- 核电厂汽轮机热力性能试验计算与分析.pdf
- 核电工业重工化发展模式下基荷低碳能源的选择.pdf
- 核能开发利用之放射性污染及其研究现.pdf
- 格兰杰因果关系检验在面板数据上的应用研究.pdf
- 桂林喀斯特景观开发建议与对策研究.pdf
- 桂林漓江流域喀斯特地区自然资源开发利用研究.pdf
- 桃花扇与史实的巨大差别.pdf
- 桃蚜对不同植物挥发物的趋性选择研究.pdf
- 2025广州银行外访催收团队专题招聘历年试题汇编及答案解析(夺冠).docx
- 2025年国考申论高分技巧实战卷.docx
- 2025年国考网络技术封闭进阶模拟试卷.docx
- 事业单位职测全真模拟卷:事业单位考试备考复习计划.docx
- 2025年省考行测申论写作冲刺试卷.docx
- 2025河北秦皇岛县(区)总工会工会招聘社工工作人员16人参考题库及答案解析(夺冠).docx
- 2025河南南阳市康复医院(第九人民医院)南阳市中心医院紧密型医联体医院人才招聘27人笔试题库带答案.docx
- 2025第二批次贵州安顺市重点人才“蓄水池” 需求岗位专项简化程序招聘7人笔试参考题库带答案解析.docx
- 2025广东南粤银行珠海分行招聘历年题库带答案解析.docx
- 2025河北承德市公安局公开招聘警务辅助人员70名历年真题题库带答案解析.docx
最近下载
- 基于改进粒子群算法的异构并行车间多目标生产调度优化研究.docx VIP
- 新修订公司法专题讲座课件.pptx VIP
- 《便携式挥发性有机物检测仪(FID)技术要求及监测规范》编制说明.docx VIP
- 2025年浙江省医疗器械专业技术资格考试(医疗器械专业知识与技能)历年参考题库含答案详解(5卷).docx VIP
- 杭州优迈smart使用说明书.pdf
- 垃圾渗滤液处理站运维及渗滤液处理投标方案(技术标).docx
- 《中医技术操作规范 中医正念团体心理治疗》(TGDACM 0133-2024).pdf VIP
- 餐饮员工考勤表.xlsx VIP
- YY_T 0003-2023 手动病床标准.pdf
- 2025年信息系统安全专家信息安全保险与风险转移专题试卷及解析.pdf VIP
原创力文档


文档评论(0)