数据流程服务技术规范第1部分真题技术 .pdfVIP

数据流程服务技术规范第1部分真题技术 .pdf

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据流程服务技术规范

第1部分:通用技术

1范围

本标准规定了数据流程服务技术的体系规范,适用于数据流程服务需求方、数据流程服

务方、数据交易所、行业协会及行业管理部门在相关业务规范中作为参照,主要适用于:

a)数据流程服务需求方采购数据流程服务时,对数据和服务产品及其供应商进行评价;

b)从事数据流程服务、销售数据产品的企业或机构,建立数据和服务产品技术规范;

c)从事数据资产评估、数据交易服务的企业和机构,建立数据和服务产品交易规则、

规范;

d)政府相关管理部门、产业园区等对数据流程服务进行事中、事后监管核查;

e)其他需要应用的场合。

2规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适

用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

GB/T38667-2020信息技术大数据数据分类指南

GB/T36344—2018信息技术数据质量评价指标

3术语和定义

下列术语和定义适用于本文件。

3.1数据流程服务

英文首字母缩写DPS,DataProcessService,是围绕数据处理流程形成的一系列服务,

它使用数字技术,从实体世界或信息系统中采集、获取数据,并按后续应用、流通要求处理、

输出数据。

3.2数据采集和预处理

指下述服务及产生的数据。采集事实、概念或指令等对象信息,形成原始数据,并对其

进行处理,以保证数据质量达到后续使用的规范性要求。

3.3数据分析集成

指下述服务及产生的数据。分析多源数据,进行集成融合,以满足后续应用和服务的规

范性要求。

3.4数据标注

指下述服务及产生的数据。通过标记、注释等工作,对数据进行处理,提取对象的特征,

以保证数据质量达到后续数字应用使用的规范性要求。

3.5内容审核

1

指下述服务及产生的数据。对互联网用户上传、发布或共享的内容(文字,图片,音频,

视频等数据)进行识别,通过标记、注释等工作,提取违反相关法规或应用要求的内容特征,

为后续处理提供依据的服务。

3.6数据流通分发

指下述服务及产生的数据。按照数据流通需要,对数据进行脱敏、隐私化、标准化处理

并对外输出开发。

3.7数据流程服务工具平台

为DPS各项业务开发和提供用于服务操作、管理的工具软件及业务平台。

3.8数据流程支持服务

支持DPS企业、从业者和相关机构提升能力、加强合作、便利交易的服务,如业务培训、

规范评价等。

3.9结构化数据/非结构化数据

按结构化特征分类,数据可划分为:结构化数据,如零售、财务、生物信息学、地理数据

等;非结构化数据.如图像、视频、传感器数据、网页等;半结构化数据.如应用系统日志、

电子邮件等。(GB/T38667-2020,7.2.3按结构化特征分类)

3.10数据需求方/数据服务客户

指提出数据服务需求的机构,包括组织内部的部门和外部的机构,在本标准中统称为需

求方。需求方一般包括行业用户、人工智能企业和行业应用开发企业和机构。

3.11数据服务方/数据服务供应商

指为需求方提供数据服务的机构,包括组织内部的部门和外部的机构,在本标准中统称

为服务方。

3.12变更数据捕获(CDC)

变更数据捕获(CDC,ChangeDataCapture),它是数据库领域的技术,主要用于捕获数

据库的一些变更,然后可以把变更数据发送到下游。

3.13语音/文本/图像/视频/点云数据

指以音频、文本、图像、视频、点云形式存在的,含有一定内容的原始的,或附有经过

标注处理而产生的文字和标签的音频、文本、图像、视频、点云,统称为语音/文本/图像/

视频/点云数据。

点云是某个坐标系下的点的数据集。每个点包含了三维坐标、颜色、强度值等信息。点

云在普通图像的基础上多了一个维度,直接提供了三维空间数据。

3.14语音活动检测

语音活动检测,又称语音端点检测,语音边界检测。目的是从声音信号流里识别和消除

长时间的静音期,以达到在不降低业务质量的情况下节省话路资源的作用,它是IP电话应用

的重要组成部分。静音抑制可以节省宝贵的

文档评论(0)

157****2173 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档