- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE
PAGE 24
郑州市档案数字化技术标准(试行)
范围
本标准规定了按案卷级、文件级整理的纸质档案、照片档案、实物档案等数字化加工后形成的电子档案数据要求。
标准引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。
DA/T18-1999 档案著录规则
DA/T31-2005 纸质档案数字化技术规范
DA/T1-2000 档案工作基本术语
GB/T11182-89 科学技术档案构成的一般要求
DA/T 22-2000 归档文件整理规则
术语和定义
本标准采用下列术语和定义。
3.1 电子档案数据
电子档案数据指通过纸质档案、照片档案、实物档案等数字化加工后形成的电子数据,分为档案目录数据和档案图像数据两种类型。
3.2 档案目录数据
将描述档案内容和形式特征的数据按一定格式存入计算机存储器所形成的数据集合,具有数据检索、存取、修改、增删和整理等功能,分为案卷目录、卷内文件目录和归档文件目录数据。
3.3 档案图像数据
纸质档案、照片档案、实物档案等数字化加工后,按照档号命名规则命名,能与档案目录数据挂接并形成可以用于检索的图像文件。
3.4 档号
以字符形式赋予纸质档案数据的用以固定和区分不同档案的一组代码,分为案卷级档号和文件级档号,
纸质案卷级档号为:全宗号·年度·保管期限·机构(问题)—室编卷号;
纸质文件级档号为:全宗号·年度·保管期限—室编件号。
科技档案案卷级档号为:全宗号·年度·保管期限·分类号·项目编号—案卷号。
科技档案文件级档号为:全宗号·年度·保管期限·分类号·项目编号·案卷号—卷内顺序号。
3.5 原文路径
原文路径是数据库目录中的字段项,用于文件目录与图像数据的挂接,通常由系统自动生成。
3.6 OCR识别
OCR识别通称为文字识别,在扫描过的档案上获取的文字图片信息,按通用格式存储在文本文件中,OCR识别后的一个重要的应用就是实现对图像文件的自动识别,识别后形成文本文件,可以用来再编辑或形成全文索引库,提高检索利用效率。
3.7 双层PDF
双层PDF指将通过扫描仪扫描后档案图像数据经过OCR识别生成可以全文检索的PDF文件, 其特点是具有多层结构,包括图层和文字层,这样,既可以100%保留原始版面效果(包括公章、签名),又可以通过下层的文字信息支持选择、复制、全文检索等功能。
4 数据整理及格式要求
4.1 数据整理基本要求
4.1.1 数据的一致性要求
本着与实体档案一致的原则,数据结构以全宗为单位,推荐采用全宗号—年度—保管期限—机构(问题)的分类方式。
4.1.2 数据完整性要求
移交电子档案数据应保证数据完整,不得有缺卷、缺页的情况。
4.2目录数据要求
4.2.1 架构要求
目录数据按照DA/T18-1999《档案著录规则》的要求进行著录,要求建立含有案卷级和文件级两级目录的数据库。
目录数据格式
目录数据格式应考虑数据迁移的通用性,移交目录数据为XML、EXCEL(格式从郑州市档案信息网下载)、MDB、DBF文件格式。
4.2.3目录数据对应关系
档案目录数据中案卷级目录和卷内文件目录应当有对应字段,一般以案卷级档号字段对应。
4.2.4文书档案案卷级目录数据库结构
具体的数据库表结构见附录A:1.文书档案案卷级目录。
4.2.5文书档案卷内文件目录数据库结构
具体的数据库表结构见附录A:2.文书档案卷内文件目录。
4.2.6文书档案归档文件目录数据库结构
具体的数据库表结构见附录A:3.文书档案归档文件目录。
4.2.7科技档案案卷级目录
具体的数据库表结构见附录A:4.科技档案案卷级目录。
4.2.8科技档案卷内文件目录
具体的数据库表结构见附录A:5.科技档案卷内文件目录。
4.2.9照片档案目录
具体的数据库表结构见附录A:6.照片档案目录。
4.2.10实物档案目录数据库结构
具体的数据库表结构见附录A:7.实物档案目录。
4.2.11
如纸质档案中有领导批示、破损及考证时间等需要说明的问题,在相应案卷级目录、卷内文件目录和归档文件目录数据备注项中注明。
4.2.12
目录数据中的时间项一律用8位字符型表示,年、月、日无法确定的补零充填。如为考证时间,应在备注项注明,时间项内也不能有“?”、“()”等字符。示例见附录E。
4.3图像数据要求
4.3.1 图像数据格式
图像数据移交格式要求为多页TIFF格式及OCR识别转换后的双层PDF格式。
4.3.2 图像数据命名方式
图像数据命名方式要求按照档号命名规则命名。
4.3.3 图像扫描色彩模式及其它参数
图像扫描模式采用黑白
文档评论(0)