- 1
- 0
- 约3.29万字
- 约 47页
- 2026-04-28 发布于江西
- 举报
数据湖技术应用手册
数据湖架构设计与规划
第1章数据湖分层架构详解
第一节数据湖分层架构详解
1.1核心数据分层模型
数据湖分层架构是构建高效、可扩展数据仓库的基础,其核心在于通过物理隔离实现数据的逻辑复用。ODS(OperationalDataStore,操作存储层)作为数据湖的入口层,直接负责从各类异构源系统(如ERP、CRM、IoT设备)实时或准实时采集原始数据,不进行任何清洗或转换,确保数据的原始性和完整性,为后续处理提供“新鲜数据”。DWD(DetailedDataWarehouse,明细数据仓库层)位于ODS之上,负责将ODS层的数据进行标准化清洗、去重、归一化和格式转换,消除不同源系统间的差异,统一的明细数据,为分析提供高质量的基础事实表。
1.2维度层构建策略
在DWD层基础上,DWS(DistributedDataWarehouse,分布式数据仓库层)通过聚合计算将明细数据按业务主题进行汇总,形成宽表或星型结构的数据集,例如按天、周、月聚合用户行为数据或交易流水数据,减少冗余并加速下游分析查询。ADS(ApplicationDataStore,应用数据层)是面向最终用户和业务应用的视图层,它不再存储原始明细,而是基于DWS层的高频数据,通过多维建模(如OLAP模型)快速报表、驾驶舱和实时大屏,确保业务人
原创力文档

文档评论(0)