- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据质量管理的12维度
The 12 Dimensions of Data Quality
编译: MTC-DQM
数据质量维度:就像买钻石
买钻石的时候我们会关注
钻石5C,即通过查看钻石的颜
色、切割工艺、亮度、克拉还
有价格以确认钻石的品质。而
数据质量维度就是数据质量的
评估标准,它衡量的是数据的
精确性、完整性、重复性、存
取性、关联性、一致性、及时
性、易用性、客观性等等。不
同企业对数据质量维度的标准
不尽相同。
关注数据质量维度的原因
每一数据质量维度需要不同的度量工具、技术和流程。这就导致了完成评估所需
要的时间、金钱和人力资源会呈现出差异。在清楚了解评估每一维度所需工作的情况
下,选择那些满足需要的维度,便可较好地界定项目范围。数据质量维度的初步评估
结果是确定基线,其余评估则作为继续检测和信息改进的一部分,作为业务操作流程
的一部分。
区分数据维度有助于:
• 将维度与业务需求相匹配,并且划分评估的先后顺序。
• 了解从每一维度的评估中能够/不能够得到什么。
• 在时间和资源有限的情况下,更好地定义和管理项目计划中的行动顺序。
数据质量维度的定义
一个数据质量维度(Data Quality Dimensions)提供一种测量与
管理信息和数据的方式。
数据质量维度
1.数据规范 2.数据完整性准则
3.重复性 4.准确性
5.一致性和同步 6.及时性和可用性
7.易用性和可维护性 8.数据覆盖
9.表达质量 10.可理解性、相关性和可行信度
11.数据衰变 12.效用性
1.数据规范
定义:对数据标准、数据模型、业务规则、元数据和参考数据进行有关存在
性、完整性、质量及归档的测量标准。
说明:
◎ 数据规范化为比较数据质量评估结果提供标准,且为手动录入数据、设
计数据加载程序、更新信息及开发应用软件提供操作指南。
2.数据完整性准则
定义:对数据进行有关存在性、有效性、结构、内容及其他基本数据特征的
测量标准。
说明:
◎ 所有其他质量维度都以数据完整性准则的内容为基础。
◎ 该维度包括对基本数据的质量的测量,例如完整性/填充率、有效性、数
值和频率分布列表、样式、范围、最大值和最小值,以及参考完整性。
◎ 具体的数据剖析能力和结果会随着使用不同的特定剖析工具而改变。
3.重复性
定义:对存在于系统内或系统间的特定字段、记录和数据集意外重复的测量
标准。
说明:
◎ 许多隐藏成本与重复记录有关。比如,姓名相同而地址不同的重复的卖
主信息,使我们难以保证支付款项能否送达正确的地址。当一家公司的采购
与重复的主记录相关联时,这家公司的信贷限额在不知不觉中就超支了。这
会给企业带来不必要的信用风险。
First Last Address City State Postal Country Country
…
name name Code Code
Sally Smith 123 Main Anywhere MN 50000- USA 001 …
Street 3000
… … … … … … … …
您可能关注的文档
最近下载
- 新能源汽车专业实训室建设方案(供货价200万)2021108.doc VIP
- 王浩—水资源全过程动态评价理论方法与实践.ppt VIP
- 部编版小学语文四年级下册第6课《飞向蓝天的恐龙》精品课件.pptx
- 水池满水试验规定(闭水试验).pdf VIP
- 专题1.6 角平分线的判定与性质【十大题型】(举一反三)(北师大版)(原卷版).docx VIP
- 潍柴WD615系列柴油机使用与维修中册.pdf VIP
- 高中全套思维导图.doc VIP
- 医防融合的课件.pptx VIP
- 预检分门诊消毒隔离制度.docx VIP
- Unit 3 Same or Different ? Section A 2a~2e 课件+内嵌音频.pptx VIP
文档评论(0)