- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
学而不知道,与不学同;知而不能行,与不知同。——黄睎
基础数据标准落标白皮书(上)
一、数据标准概述
1.定义
数据是由特定的环境产生的,这些环境因素包括生产者,时间,
系统等,这就造成了同一个语义的数据,会有多种不同的定义方法,
这给后期进行数据汇集和整合带来障碍,因此,数据处理的前奏就是
数据标准化,数据标准作为一个统一的数据共识,在企业的标准化中
起到重要作用。
数据标准一般包括下面几个,为了统一本文阅读共识,列出如下:
1.基础数据标准:标准是针对数据原始定义,一般面向原系统数
据或ODS层数据。包括业务语义,管理标准,技术规范,质量要求等。
2.指标体系:标准针对衍生型数据,一般面向集市层的报表等计
算型数据。
3.标准代码:具体指数据标准中的枚举值和语义,可以作为基础
数据标准的一部分,数据标准维度也是大部分来源于此。
4.标准编码:特指主数据治理中的实体对象数据的唯一编码和规
则,比如设备唯一编码。
5.业务术语词典:指企业数据定义过程中,从业务名词到物理表
和字段的标准化翻译的词根和词素。
6.其他规范:包括数据库设计规范,元数据规范,模型规范等,
具体可以在其他治理活动下定义,也是广义数据数据标准的一部分。
一般情况下,本文所述的数据标准落标主要指:
(a)基础标准落标(c)标准代码落标
(e)命名标准落标
指标体系的落标因为在数据后期,是比较容易实现的,因此不在
重点讨论中。标准编码则特定于主数据治理过程中实现,不在此赘述。
2.落标概述
数据标准的落标意义在于,企业由此开始进行数据驱动文化,开
学而不知道,与不学同;知而不能行,与不知同。——黄睎
始从源头进行数据的标准化生产,加速数据的融合与统一的效率,节
省大量数据应用和处理的成本。
数据标准的落标程度可以分为基本拉通型落标和全局管控型落标。
基本拉通型落标是指设计的数据元素符合数据标准的基本语义和
业务规则,物理定义符合技术规范,具体数据语义可以进行无规范的
衍生。落标范围重点是核心业务系统的核心标准和交叉标准,还有数
据仓库系统的。这种类型适合中小银行的上手阶段,以及没有重大系
统升级机会的系统,其核心目的是减少数据融合成本,加速数据消费
的效力,适合进行数据化驱动转型的企业。
全局管控型落标是指设计的数据元素符合数据标准的基本语义和
业务规则,物理定义符合技术规范,具体的物理数据语义需要进行有
规范的衍生,数据质量需要落地为数据库约束或者质量验核规则。落
标范围是核心业务系统和重点业务系统,以及数据仓库等衍生系统。
这种适合IT能力强,数据基础好的企业。其核心目标是掌控企业全局
数据,做到数据快速迭代,适合致力于打造数据快速创新型企业。
3.落标过程中的衍生
数据在落标过程中是可以进行一定程度的数据语义衍生的,比如
电话号码衍生为供应商电话。如果衍生的字段有确实的细化语义,或
者其他业务要求,就需要也有一些数据标准需要定义为子类标准或者
同义标准。
子类标准
当一类数据标准有进行细化的必要,并带来特定的语义和业务规
则,就需要在原有标准上进行衍生。比如“电话“衍生为”手机“和
“座机“,这是因为这两类衍生
文档评论(0)