数据质量管理的12维度.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据质量管理的12维度 The 12 Dimensions of Data Quality 编译: MTC-DQM 数据质量维度:就像买钻石 买钻石的时候我们会关注 钻石5C,即通过查看钻石的颜 色、切割工艺、亮度、克拉还 有价格以确认钻石的品质。而 数据质量维度就是数据质量的 评估标准,它衡量的是数据的 精确性、完整性、重复性、存 取性、关联性、一致性、及时 性、易用性、客观性等等。不 同企业对数据质量维度的标准 不尽相同。 关注数据质量维度的原因 每一数据质量维度需要不同的度量工具、技术和流程。这就导致了完成评估所需 要的时间、金钱和人力资源会呈现出差异。在清楚了解评估每一维度所需工作的情况 下,选择那些满足需要的维度,便可较好地界定项目范围。数据质量维度的初步评估 结果是确定基线,其余评估则作为继续检测和信息改进的一部分,作为业务操作流程 的一部分。 区分数据维度有助于: • 将维度与业务需求相匹配,并且划分评估的先后顺序。 • 了解从每一维度的评估中能够/不能够得到什么。 • 在时间和资源有限的情况下,更好地定义和管理项目计划中的行动顺序。 数据质量维度的定义 一个数据质量维度(Data Quality Dimensions)提供一种测量与 管理信息和数据的方式。 数据质量维度 1.数据规范 2.数据完整性准则 3.重复性 4.准确性 5.一致性和同步 6.及时性和可用性 7.易用性和可维护性 8.数据覆盖 9.表达质量 10.可理解性、相关性和可行信度 11.数据衰变 12.效用性 1.数据规范 定义:对数据标准、数据模型、业务规则、元数据和参考数据进行有关存在 性、完整性、质量及归档的测量标准。 说明: ◎ 数据规范化为比较数据质量评估结果提供标准,且为手动录入数据、设 计数据加载程序、更新信息及开发应用软件提供操作指南。 2.数据完整性准则 定义:对数据进行有关存在性、有效性、结构、内容及其他基本数据特征的 测量标准。 说明: ◎ 所有其他质量维度都以数据完整性准则的内容为基础。 ◎ 该维度包括对基本数据的质量的测量,例如完整性/填充率、有效性、数 值和频率分布列表、样式、范围、最大值和最小值,以及参考完整性。 ◎ 具体的数据剖析能力和结果会随着使用不同的特定剖析工具而改变。 3.重复性 定义:对存在于系统内或系统间的特定字段、记录和数据集意外重复的测量 标准。 说明: ◎ 许多隐藏成本与重复记录有关。比如,姓名相同而地址不同的重复的卖 主信息,使我们难以保证支付款项能否送达正确的地址。当一家公司的采购 与重复的主记录相关联时,这家公司的信贷限额在不知不觉中就超支了。这 会给企业带来不必要的信用风险。 First Last Address City State Postal Country Country … name name Code Code Sally Smith 123 Main Anywhere MN 50000- USA 001 … Street 3000 … … … … … … … …

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档