DB37T 4648-2023 公共数据 历史数据 数字化工作指南  .docxVIP

DB37T 4648-2023 公共数据 历史数据 数字化工作指南  .docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

ICS35.240CCSL67

37

山东省地方标准

DB37/T4648—2023

公共数据历史数据数字化工作指南

Publicdata—Guidelinesforhistoricaldatadigitization

2023-08-31发布2023-09-30实施

山东省市场监督管理局发布

DB37/T4648—2023

I

目次

前言 II

1范围 1

2规范性引用文件 1

3术语和定义 1

4缩略语 1

5工作流程 2

6总体计划 2

7数据调研分析 2

8历史数据借阅 2

9数据结构化 2

9.1概述 2

9.2扫描识别 2

9.3手工录入 3

10数据校对 3

11数据存储归档 4

11.1数据存储 4

11.2历史数据归档 4

参考文献 5

DB37/T4648—2023

II

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由山东省大数据局提出、归口并组织实施。

DB37/T4648—2023

1

公共数据历史数据数字化工作指南

1范围

本文件给出了文本资源历史数据数字化的指导和建议。

本文件适用于各级公共管理和服务机构文本资源历史数据数字化的规划、实施和管理。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

GB/T31219.2—2014图书馆馆藏资源数字化加工规范第2部分:文本资源DB37/T4646.2—2023公共数据数据治理规范第2部分:数据清洗比对

3术语和定义

下列术语和定义适用于本文件。3.1

文本text

以字符、符号、词、短语、段落、句子、表格或者其他字符排列形成的数据,用于表达意义,其解释基本上取决于读者对于某种自然语言或者人工语言的知识。

[来源:GB/T4894—2009,4.1.1.2.4]3.2

数字图像digitalimage

表示实物图像的整数阵列,一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。[来源:DA/T31—2017,3.2]

3.3

归档filing

办理完毕且具有保存价值的文件经系统整理交档案室或档案馆保存的过程。[来源:DA/T1—2000,3.1.1]

4缩略语

下列缩略语适用于本文件。

DPI:每英寸点数(DotsPerInch)

JPEG:联合图像专家组(JointPhotographicExpertsGroup)OCR:光学字符识别(OpticalCharacterRecognition)

OFD:开放版式文档(OpenFixed-layoutDocument)PDF:可携带文档格式(PortableDocumentFormat)TIFF:标签图像文件格式(TagImageFileFormat)

DB37/T4648—2023

2

5工作流程

开始总体计划数据调研分析历史数据借阅数据存储归档数据校对 结束历史数据数字化流程包括总体计划、数据调研分析、历史数据借阅、数据结构化、数据校对、数据存储归档,见图1。

开始

总体计划

数据调研分析

历史数据借阅

数据存储归档

数据校对

结束

数据结构化

数据结构化

扫描识别

手工录入

图1历史数据数字化流程

6总体计划

宜综合考虑本机构实际业务工作情况、文本资源历史数据的利用率、共享和开放程度、价值等因素,制定历史数据数字化总体计划并形成工作方案,包括工作目标、工作原则、历史数据范围、组织保障、管理制度、人员安排及责任分工、进度安排、工作流程等。采取外包方式实施时,承担历史数据数字化工作的机构和人员遵守相关信息保密规定,并签订保密协议。

7数据调研分析

依据工作方案,调研分析本机构文本资源历史数据现状,包括数据内容、数据分布情况、数据存储介质、存储地点、数字化程度、数据量、数据质量状况、纸质形态,以及历史数据存储管理

您可能关注的文档

文档评论(0)

天使之恋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档