《纸质档案数字化技术规范》(DA--T 31-2005).doc

《纸质档案数字化技术规范》(DA--T 31-2005).doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《纸质档案数字化技术规范》(DA/T?31-2005) (2008-05-07 12:48:46) 6 建目录库 6.1 目录著录根据DA/T18确定档案著录项,并进行著录。 6.2 数据格式选择所选定的数据格式通用,应能直接或间接与DBF文件格式或通过XML文档进行数据交换。 6.3 目录输入将著录好的目录输入计算机内,建立机读目录数据库。 7 批量扫描 7.1 扫描方式 纸质档案扫描可采用黑白二值图像和连续色调图像两种方式。 7.1.1 页面为单色文字的纸质档案,宜采用黑白二值图像扫描;页面为多色文字图像的档案文件,可采用连续色调图像扫描。 7.1.2 字迹清晰、不带图片的档案材料,采用黑白二值图像扫描;清晰度较差或带有图片的档案材料,可采用连续色调图像扫描。 7.2 分辨率选择 7.2.1 单色页面档案文件,扫描分辨率一般建议选择100~200dpi。 7.2.2 彩色页面档案文件,扫描分辨率可选择100dpi以上参数值进行。 7.2.3 大幅面档案文件,如工程图纸、报纸等尺寸超过A3的,可选用大幅面图像扫描仪(如A0)、大幅面数码平台、缩微照像后胶片数字转换,也可以采用小幅面扫描后的图像拼接。扫描分辨率应选择1OOdpi以上。 7.2.4 需要时可根据原件的清晰度适当调整扫描分辨率。如原件质量较差且尺寸较小,可适当提高分辨率;反之也可相应减少分辨率,增减的多少以扫描后图像按原尺寸显示后是否清晰为准。 7.3 特殊页面的扫描 7.3.1 粘贴页与表格 对于粘贴折页,可用大幅面扫描仪扫描,或先分部扫描后拼接;对部分字体很小、字迹密集的情况,可适当提高扫描分辨率,选择灰度扫描或彩色扫描,采用局部深化技术解决;对字迹与表格颜色深度不同的,采用局部淡化技术解决 7.3.2 一般文本流程图 采用适当的分辨率扫描及局部深化技术,确保文本流程图清晰。同时采用不同设备满足文本流程图的扫描工作。 7.3.3 插图 采用高分辨率灰度或彩色扫描技术将插图与文字一起扫描,保证原来的页面布局和插图清晰。 7.3.?4照片 对于页面中有黑白或彩色照片的文件,采用JPEG格式扫描,确保照片清晰度,同时可避免图像存储空间过大。 7.4 文件命名方式 7.4.1 建立文件夹 扫描时文件夹的建立应按档案实体分级建立,其中的每一份文件也需要单独建立文件夹。 7.4.2 文件夹命名方法,以档案实体中的档号命名,一般为3位数,不足3位数的左边补“0”。 8 数据处理 8.1 图像处理 8.1.1 纠偏 对扫描过程中出现的偏斜图像进行整体纠正,保证数字图像的偏斜角度小于1度。(图像偏斜不超过页面内半个文字)。 8.1.2 去污 去除数字图像中影响可懂度的杂质。档案数字化图像的去污,应遵循在不影响可懂度的前提下展现原貌的原则。 8.1.2.1 局部去污,如去除黑边、污点。 8.1.2.2 整体去污,可一次性去除页面上的污渍。 8.1.3 拼接 为保证档案数字化图像的整体性,对幅面分离的数字图像进行拼接。 8.1.4 校对 8.1.4.1 一次校对,检查扫描完的图像质量情况,对不合格的图像进行标记退回重新扫描。 8.1.4.2 纠错处理,根据一次校对中提出的诸如污渍、黑边、偏斜、图像质量等问题,结合《数据加工过程处理单》(见附录A)情况,对每份图像进行相应的处理。 8.1.4.3 二次校对,对一次校对及数据处理后的数字图像再次进行检查,并标记图像处理过程中不清晰的页面。不合格的退回重新处理。 8.2 数据质量检查 8.2.1 文字录入质量 对录入域清单上所标明的各著录项的文字录入进行正确率控制,保证错误率低于3‰。 8.2.2 图像质量 对纸质文件扫描后形成的图像文件进行清晰度、污渍、黑边、偏斜等问题的控制,以达到要求的图像质量。保证扫描后的数字图像清晰,便于清楚阅读,适应各种纸张和手写、印刷字的情况。 8.3 数据挂接 档案条目数据与图像文件的对应准确程度的控制。 在生成裸数据光盘之前,根据资料整理信息、扫描前的标引信息及卷内文件页号信息核查图像文件总数是否与实际文件数相等,如不相等则不能生成裸数据光盘,可打印出清单,回退给图像处理人员补扫。 8.4 数据检验 8.4.1 将裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件。 8.4.2 对数据进行检验,给出合格或不合格结论。 8.4.3 将数字加工后的数据转换为裸数据光盘格式,拷贝到活动硬盘上。 8.4.4 系统应自动记录检验进度。 8.5 数据上载 档案数字化各工序的数据通过网络及时上载到数据服务器端汇总,其中数字图像自动搜索对应的目录数据,加入对应的电子地址数字图像文件名,建

文档评论(0)

朱海龙 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档