- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据建模介绍
数据仓库构造方法
支付宝业务系统简介
业务特点
类金融交易:充值、提现、账务管理
类电子商务:购物交易过程变更、实际交易(对B机票、对C水电等)
非纯电子商务;纯金融
线上子系统多而杂
截止到2011年6月共有各类线上子系统259个
类型多样:对C、对B、对内、对金融机构
系统间依赖程度参差不齐
垂直依赖(业务与核心)
跨层依赖(跨过交易到账务)
支付宝业务系统
支付宝数据仓库架构原则
底层业务的数据驱动为导向同时结合业务需求驱动
便于数据分析
屏蔽底层复杂业务
简单、完整、集成的将数据暴露给分析层
底层业务变动与上层需求变动对模型冲击最小化
业务系统变化影响削弱在基础数据层(资金订单改造)
结合自上而下的建设方法削弱需求变动对模型的影响
数据水平层次清晰化
高内聚松耦合
主题之内或各个完整意义的系统内数据的高内聚
主题之间或各个完整意义的系统间数据的松耦合
构建仓库基础数据层
使得底层业务数据整合工作与上层应用开发工作相隔离,为仓库大规模开发奠定基础
仓库层次更加清晰,对外暴露数据更加统一
传统仓库架构方法
需求驱动为主
…
支付宝交易主题现状
数据仓库模型建设目标示意图
仓库基础数据层建设的意义
避免底层业务变动对上层需求影响过大
屏蔽底层复杂的业务逻辑,尽可能简单、完整的在接口层呈现业务数据
仓库数据更加丰富
建设高内聚松耦合的数据组织,使得数据从业务角度可分割,有助于数据和团队的扩展。
第三方支付企业支付宝数据仓库体系结构
建立企业级概念数据模型(CDM) 的基本架构
九大数据概念变迁
第三方支付企业支付宝数据模型设计
基于OMG推出的数据仓库元数据管理的CWM模型(Common Warehouse Metamodel)
物理模型设计 PDM设计方法
参考IBM的FSDM金融行业的数据仓库通用模板
参考NCR Teradata 金融服务逻辑数据模型(FS-LDM ),
参考新巴塞尔资本协议(Basel II Capital Accord)需提供三到五年的数据的规范
综合上述规范和要求,同时结合支付宝实际的业务,
推出数据仓库5层架构体系
DW五层模型是按照EDW各个应用层次的需求进行分层细化而来的,每个层次满足不同的应用。
分为以下5层:
1. ODS 数据准备层
2. DWD 数据明细层
3. DW(B/S) 数据汇总层
4. DM 数据集市层
5. ST 数据应用层
DW五层模型架构介绍
DW五层模型架构介绍
DW模型架构第一层介绍-ODS层
功能
ODS层是数据仓库准备区
为DWD层提供基础原始数据
减少对业务系统影响
建模方式及原则
数据保留时间根据实现业务需求而定
可以分表进行周期存储,存储周期不长
数据不做清洗转换和业务系统一样
按主题逻辑划分
数据模型和粒度和业务系统数据模型保留一致(3NF)
从业务系统以增量方式抽取加载到ODS
DW模型架构第二层介绍-DWD层
功能
为DW层提供来源明细数据
提供业务系统细节数据的长期沉淀
为未来分析类需求的扩展提供历史数据支撑
建模方式及原则
数据模型与ODS层一致(3NF)
不做清洗转换处理
为支持数据重跑可额外增加数据业务日期字段
可按天、月、年进行分表
用增量ODS层数据和前一天DWD相关表进行 merge处理
DW模型架构第三层介绍-DW层
功能
为DM,ST层提供细粒度数据,细化成DWB和DWS
DWB是根据DWD明细数据进行清洗转换,如维度转代理键、身份证清洗、会员注册来源清洗、字段合并、空值处理、脏数据处理、IP清洗转换、账户余额清洗 、资金来源清洗等
DWS是根据DWB层数据按各个维度ID进行粗粒度汇总聚合,如按交易来源,交易类型进行汇总
建模方式及原则
聚合、汇总增加派生事实
关联其它主题的事实表,DW层可能会跨主题域
DWB保持低粒度汇总加工数据,DWS保持高粒度汇总数据
数据模型可能采用反范式设计,合并信息等
DW模型架构第三层介绍-DW层
DW模型架构第四层介绍-DM层
功能
这一层可以是一些宽表,是根据DW层数据按照各种维度或多种维度组合把需要查询的一些事实字段进行汇总统计并作为单独的列进行存储
满足一些特定查询、数据挖掘应用
应用集市数据存储
建模方式及原则
尽量减少数据访问时计算,优化检索
维度建模,星形模型
事实拉宽,度量预先计算
分表存储
DW模型架构第四层介绍-DM层
DW模型架构第五层介绍-ST层
功能
ST层面向用户应用和分析需求,包括前端报表、分析图表、KPI、仪表盘、OLAP、专题等分析,面向最终结果用户
适合作OLAP、报表模型,如ROLAP,MOLAP
根据DW层经过聚合汇总统计后的粗粒度事实表
建模方式
文档评论(0)