数据治理缺失导致混乱局面:指标不一、冗余计算与数据错误.pdfVIP

  • 1
  • 0
  • 约小于1千字
  • 约 1页
  • 2026-05-21 发布于北京
  • 举报

数据治理缺失导致混乱局面:指标不一、冗余计算与数据错误.pdf

《115_如果你不做数据治理,会呈现怎样的局面?(续)》

(1)指标口径不统一

大家用的英文单词做的一个字段是一样的名字,,背后的含义不同

大家明明有一个指标应该是一样的含义,在哥儿们A设计的一张表,total_amount;哥儿们

B设计的另外一个表里,daily_received_money

(2)冗余计算

每个人都是各自为政,DWT,DWA,把一些需要做的关联和聚合,放在两层里统一来做就

可以了,你没有必要在每个报表的ETL里(APP层),都重复的进行关联和聚合,这是没有

必要的

瞎搞,哥儿们A,根本就不管什么DWT、DWA,直接就是写一个报表,里面干出来800行

的大SQL,把各种join、聚合都搞了一遍;哥儿们B,也不管什么DWT、DWA,直接干出来

一个500行的大SQL,各种join、聚合都搞了一遍

做报表的时候,直接就是基于DWT/DWA搞就可以了,大家不需要做重复的关联和聚合

(3)数据质量

跑出来的报表,数据可能都是错的,不同的人对你写的ETL到底有没有bug,算出来的数据

到底是不是对的,你心里根本就没底的

指标、冗余计算、数据错误

文档评论(0)

1亿VIP精品文档

相关文档