数字技术 数据元件 质量评价与管理-20231008.pdfVIP

数字技术 数据元件 质量评价与管理-20231008.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
T/CIITA 411-2023 数字技术 数据元件 质量评价与管理 1 范围 本文件明确了数据元件质量管理的框架、质量评价指标、质量评价模型、质量评价流 程和质量管理机制,规范了数据元件质量评价的指标、方法和流程。 本文件适用于数据元件开发设计、使用中的质量评估,为数据运营商评估数据元件质 量和管理提供相关指导。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日 期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本 (包括所有的修改单)适用于本文件。 GB/T 25069-2010 信息安全技术 术语 GB/T 37973-2019 信息安全技术 大数据安全管理指南 GB/T 37988-2019 信息安全技术 数据安全能力成熟度模型 GB/T 36344-2018 信息技术 数据质量评价指标 T/CIITA 406-2022数据元件的结构要求 3 术语和定义 T/CIITA 406-2022界定的以及下列术语和定义适用于本文件。 3.1 数据质量 data quality 在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。 [来源:GB/T 36344-2018,2.3] 3.2 数据标准 data standard 数据的命名、定义、结构和取值规范方面的规则和基准。 [来源:GB/T 36344-2018,2.8] 3.3 数据元件 data component 具有一定主题,通过对数据资源脱敏处理后,根据需要由若干相关字段形成的数据集 或由数据资源的关联字段通过建模形成的数据特征。 3.4 1 T/CIITA 411-2023 数据运营商 data operator 在获得授权运营的前提下,整合政务数据、社会数据等资源,推动数据价值开发和运 营管理的机构。 4 质量评价与管理框架 数据元件质量评价与管理建立在数据资源质量和数据元件结果质量两方面。图1给出了 数据元件生产和管理过程中的质量评价与管理的总体框架图。 图 1 数据元件质量评价与管理框架 数据元件的质量指标体系主要由数据资源质量评价指标和数据元件结果评价指标构成。 数据资源质量评价指标包括以下方面: ——数据资源完整性, ——数据资源规范性, ——数据资源准确性, ——数据资源唯一性, ——数据资源一致性, ——数据资源时效性。 数据元件结果质量评价指标包括以下方面: ——数据元件结果规范性, ——数据元件结果完整性, ——数据元件结果准确性, ——数据元件结果时效性, ——数据元件结果可用性。 5 质量评价指标 5.1 质量评价指标概述 数据元件使用的数据资源和数据元件结果是影响数据元件质量的两大影响因素,对数 据元件质量的管理工作从这两方面开展。对使用的数据资源从完整性、规范性、准确性、 时效性、一致性、唯一性六个维度进行质量检测,对数据元件的结果从完整性、规范性、 准确性、时效性、可用性五个维度进行质量检测。 5.2 数据资源质量评价指标 Ⅱ T/CIITA 411-2023 5.2.1 数据资源完整性 完整性主要用于描述数据属性信息是否存在缺失数据记录。数据资源完整性可以通过 统计数据资源中缺失的记录数与数据记录总数的比例进行评价。 5.2.2 数据资源规范性 规范性指标主要用于评估数据内容与数据标准的符合度情况。一般来说包含格式合规 性和值域有效性。 5.2.3 数据资源准确性 准确性是指数据记录的信息是否存在异常或错误。准确性指标主要用于描述数据是否 与其对应的客观实体的特征

您可能关注的文档

文档评论(0)

std360 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档