- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
ICS35.240CCSL67
37
山东省地方标准
DB37/T4648—2023
公共数据历史数据数字化工作指南
Publicdata—Guidelinesforhistoricaldatadigitization
2023-08-31发布2023-09-30实施
山东省市场监督管理局发布
DB37/T4648—2023
I
目次
前言 II
1范围 1
2规范性引用文件 1
3术语和定义 1
4缩略语 1
5工作流程 2
6总体计划 2
7数据调研分析 2
8历史数据借阅 2
9数据结构化 2
9.1概述 2
9.2扫描识别 2
9.3手工录入 3
10数据校对 3
11数据存储归档 4
11.1数据存储 4
11.2历史数据归档 4
参考文献 5
DB37/T4648—2023
II
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由山东省大数据局提出、归口并组织实施。
DB37/T4648—2023
1
公共数据历史数据数字化工作指南
1范围
本文件给出了文本资源历史数据数字化的指导和建议。
本文件适用于各级公共管理和服务机构文本资源历史数据数字化的规划、实施和管理。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T31219.2—2014图书馆馆藏资源数字化加工规范第2部分:文本资源DB37/T4646.2—2023公共数据数据治理规范第2部分:数据清洗比对
3术语和定义
下列术语和定义适用于本文件。3.1
文本text
以字符、符号、词、短语、段落、句子、表格或者其他字符排列形成的数据,用于表达意义,其解释基本上取决于读者对于某种自然语言或者人工语言的知识。
[来源:GB/T4894—2009,4.1.1.2.4]3.2
数字图像digitalimage
表示实物图像的整数阵列,一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。[来源:DA/T31—2017,3.2]
3.3
归档filing
办理完毕且具有保存价值的文件经系统整理交档案室或档案馆保存的过程。[来源:DA/T1—2000,3.1.1]
4缩略语
下列缩略语适用于本文件。
DPI:每英寸点数(DotsPerInch)
JPEG:联合图像专家组(JointPhotographicExpertsGroup)OCR:光学字符识别(OpticalCharacterRecognition)
OFD:开放版式文档(OpenFixed-layoutDocument)PDF:可携带文档格式(PortableDocumentFormat)TIFF:标签图像文件格式(TagImageFileFormat)
DB37/T4648—2023
2
5工作流程
开始总体计划数据调研分析历史数据借阅数据存储归档数据校对 结束历史数据数字化流程包括总体计划、数据调研分析、历史数据借阅、数据结构化、数据校对、数据存储归档,见图1。
开始
总体计划
数据调研分析
历史数据借阅
数据存储归档
数据校对
结束
数据结构化
数据结构化
扫描识别
手工录入
图1历史数据数字化流程
6总体计划
宜综合考虑本机构实际业务工作情况、文本资源历史数据的利用率、共享和开放程度、价值等因素,制定历史数据数字化总体计划并形成工作方案,包括工作目标、工作原则、历史数据范围、组织保障、管理制度、人员安排及责任分工、进度安排、工作流程等。采取外包方式实施时,承担历史数据数字化工作的机构和人员遵守相关信息保密规定,并签订保密协议。
7数据调研分析
依据工作方案,调研分析本机构文本资源历史数据现状,包括数据内容、数据分布情况、数据存储介质、存储地点、数字化程度、数据量、数据质量状况、纸质形态,以及历史数据存储管理
您可能关注的文档
- DB37T 4549-2022 石油库碳排放核算和碳中和核定技术规范 .docx
- DB37T 4550-2022 智慧城市网络安全建设和评估指南 .docx
- DB37T 4551-2022 城市轨道交通车辆段运作规范 .docx
- DB37T 4552-2022 城市轨道交通接触轨安全规范.docx
- DB37T 4553-2022 机构编制人员经费信息共享数据规范.docx
- DB37T 4554-2022 水处理剂生产企业安全生产风险分级管控体系实施指南 .docx
- DB37T 4556-2022 普通国省道公路工程技术规范.docx
- DB37T 4560.1-2022 政府网站集约化平台 第1部分:总体要求.docx
- DB37T 4560.2-2022 政府网站集约化平台 第2部分:网站迁移规范.docx
- DB37T 4561-2022 团体标准组织发展能力评价指标体系.docx
- 第三单元解决问题的策略 三年级下册数学高频考点重难点讲义(苏教版)(1).docx
- 4.4 解比例 数学六年级下册同步培优讲义(苏教版).docx
- 第四单元《根据方向与距离确定物体位置》(教案)五年级下册数学青岛版.docx
- (奥数典型题)第三讲 分解质因数 五年级下册数学思维拓展提升讲义(人教版).docx
- 2.2:2、5、3的倍数-人教版五年级数学下册第二单元:因数和倍数.docx
- 第六单元正比例和反比例 六年级下册数学高频考点重难点讲义(苏教版).docx
- 第二单元除数是一位数的除法 三年级下册数学高频考点重难点讲义(人教版).docx
- 第二单元-认识三角形和四边形 四年级数学下册提升(北师大版).docx
- 第一单元观察物体(三)五年级下册数学高频考点重难点讲义(人教版).docx
- 第九单元 数学广角—推理 二年级数学下册重难点知识点(人教版).docx
文档评论(0)