YDT 4522-2023面向机器学习的电信数据规范 数据质量.pdf

YDT 4522-2023面向机器学习的电信数据规范 数据质量.pdf

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
ICS 33.020 CCS M10 YD 中 华 人 民 共 和 国 通 信 行 业 标 准 YD/T XXXXX—XXXX 面向机器学习的电信数据规范 数据质量 Telecommunicationdata specificationintheperspective ofmachine learning data quality 报批稿 – XXXX-XX-XX实施 XXXX-XX XX发布 中华人民共和国工业和信息化 发 布 YD/T XXXX—XXXX 前  言 本文件按照GB/T 1.1-2020 《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起 草。 本文件是面向机器学习的电信数据系列标准之一,该系列标准结构和名称如下: ——面向机器学习的电信数据规范 数据服务接口 ——面向机器学习的电信数据规范 数据模型 ——面向机器学习的电信数据规范 数据质量 ——面向机器学习的电信数据规范 数据安全能力成熟度 ——面向机器学习的电信数据规范 数据安全能力成熟度评估方法 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本文件由中国通信标准化协会提出并归口。 本文件起草单位:中国信息通信研究院、中国移动通信集团有限公司、中国联合网络通信集团有限 公司、中国电信集团有限公司、华为技术有限公司、中兴通讯股份有限公司。 本文件主要起草人:程强、刘姿杉、胡雅坤、袁丽雅、李唯源、孟瑜。 II YD/T XXXX-XXXX 面向机器学习的电信数据规范 数据质量 1 范围 本文件规定了对电信数据进行质量管理的通用原则、一般流程和评估方法,并对电信数据集在规范 性、完整性、准确性、有用性、一致性、适量性、时效性、可解释性和可靠性等维度相关的指标进行了 定义和示例说明。本文件所定义的电信数据类型主要为结构化数据,不涉及自然语言、图像等非结构化 与其他复杂类型数据。 本文件适用于电信网络运营商、设备商、服务商、软件开发者、最终用户、第三方监管机构、认证 机构或评测单位等来开展面向机器学习应用过程中电信数据的特性和质量评估相关工作,来保证电信数 据集在机器学习应用中的可用性,促进电信领域机器学习应用的开展。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 5271.1-2000 信息技术词汇 第1部分:基本术语 GB/T 5271.17-2010 信息技术词汇 第17部分:数据库 GB/T 35295—2017 信息技术 大数据 术语 3 术语和定义 下列术语和定义适用于本文件。 3.1 数据 data 信息的可再解释的形式化表示,以适用于通信、解释或处理。 [来源:GB/T 5271.1-2000, 01.01.02] 3.2 数据集 data set 具有一定主题,可以标识并可以用于机器学习训练、验证及测试等处理过程的数据形式。 3.3 元数据 metadata 关于数据或数据元素的数据 (可能包括其数据描述),以及关于数据拥有权、

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档