如何建设数据指标中心.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE PAGE 1 如何建设数据指标中心 TOC \o 1-3 \h \z \u 前言 2 1.数据指标中心的定位 2 2.数据指标中心设计 2 2.1定义指标并归集到对应的主题域 2 2.2拆分原子指标与派生指标 3 2.3定义原子指标与派生指标的生产逻辑 4 2.4通过指标管理平台对指标进行规范生产 6 ⑴规范化指标命名 6 ⑵规范化统计口径 7 ⑶规范化指标等级 8 3.数据指标中心最终呈现是怎么样 8 前言 在我们日常的数据工作中,指标的重要性毋庸置疑,指标来源于业务的场景化呈现,业务也通过指标来透视出问题,但也正因为如此重要,使用如此频繁,所以导致指标也出现各种混乱、难用、难找等等问题。所以我们必须有一套合理合规的指标治理方法,并将这套方法转化成工具,通过固定流程去约束原本不可控的行为。指标治理的有那些方法论?以及这些方法是如何设计成系统,也就是我们说的——数据指标中心 1.数据指标中心的定位 数据指标中心是规范化开发指标并对其进行管理维护的系统,将指标的组成部分解耦拆分开来,并在逻辑表中进行规范性的定义,在此基础上,后续可以按照一定规则进行自由拼装,实现自定义指标的功能。 2.数据指标中心设计 2.1定义指标并归集到对应的主题域 指标的本质是量化了的目标,比如常见的例子: ①我们要把用户的盘子做大,那对应的量化指标就是已注册用户数; ②我们要统计今天的销售额,那对应的量化指标就是总支付金额; ③我们要衡量一次活动的效果,那对应的量化指标就是下单率。 从上面的例子我们可以看到,我们比较常用的几个类型的指标就是,存量型指标(已注册用户数)、事务型指标(支付金额)、转化型指标(下单率),其它还有比例型、统计型、排名型等,这些比较不常用,就不在此赘述了。 这些不同类型的指标,分散在我们产品中的不同功能模块中,所以为了更好地规范与管理,我们需要将这些指标也按照主题域的方式归集起来。主题域在“仓库模型中心”进行创建与定义,在这里只需要将对应的指标划归到对应的主题域就行了。 2.2拆分原子指标与派生指标 先来看看原子指标跟派生指标这两个概念具体是什么? ①原子指标:是事实表中,某一个字段的统计值(sum、count、max、min、avg),如下单用户数,下单金额等; ②派生指标:是基于原子指标,进行维度组合后产生的指标,如近1天商城下单用户数,本周商城黄金会员下单金额等。 原子指标无业务意义,它只是预定义的代码片段而已。业务中用到的指标基本都是派生指标。 2.3定义原子指标与派生指标的生产逻辑 在本章的开头有提到这样一句话:“将指标的组成部分解耦拆分开来,并在逻辑表中进行规范性的定义”,这个解耦跟定义的过程,就是把一个派生指标拆解成原子指标、时间周期、限定维度、聚合粒度,然后再重新拼装,生成新的派生指标的过程: 在上面这个例子中可以这样来理解: ①统计周期是这个原子指标进行统计运算的时间范围,在这里是本周; ②聚合粒度是指标的主体,即按照哪个维度来来进行聚合,这里是黄金会员; ③限定维度是限制原子指标的计算范围,这里限定在商城,即只计算商城相关的数据; ④原子指标则是预定义的某个字段计算规则。在这里是下单金额的累加。 2.4通过指标管理平台对指标进行规范生产 ⑴规范化指标命名 命名规范对于后期大量的指标管理来说非常重要,因为当指标多起来的时候,你要找一个指标经常需要用到检索功能,而检索的前提是你对指标有一些前置的认知。这就需要我们对指标的命名进行规范化。 指标命名规范有三个重点: ①简洁明了,易懂:最好是只要看到指标名,不需要看注释就可以知道它的意思,归属等; ②格式统一:每个指标的格式都是一样的,通过组合不同模块的命名拼凑起来; ③生成统一:原子指标与继承自它的派生指标的规范是一致的。 以商城相关的指标为例: ①所有业务下单跟支付指标,默认以主单为统计口径,不用带“主单”相关字眼,如商城下单次数;当统计口径为“子单”时则需要在命名中标出,如:商城子单下单次数; ②所有与人相关指标默认以“注册用户”为统计实体,不需要带“用户”相关字眼,如访问次数;当统计主体为“游客”时则需要在命名中标出,如:游客访问次数; ③无指定业务范围的指标默认为平台指标,不需要带“平台”相关字眼,如近30天支付人数。如果有限定业务范围,则需要加上业务名称,如:商城-近30天支付人数; ④无指定时间周期的指标默认为“近1天”(但需要保存小时粒度,便于后续下钻),不需要带“时间”相关字眼,如注册人数。如果有限定时间范围,则需要加上时间周期:如:近7天注册人数。 完整的命名的规范为:商城(业务板块)+用户(实体)+近7天(统计周期)+新增(业务动作)+子单(类型)+单日(间隔周

文档评论(0)

steven + 关注
实名认证
文档贡献者

系统集成项目管理工程师、AMAC基金从业资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年08月23日上传了系统集成项目管理工程师、AMAC基金从业资格证

1亿VIP精品文档

相关文档