2025年大厂数据仓库数仓建模面试题及参考答案.docxVIP

  • 2
  • 0
  • 约6.1千字
  • 约 13页
  • 2026-05-19 发布于四川
  • 举报

2025年大厂数据仓库数仓建模面试题及参考答案.docx

2025年大厂数据仓库数仓建模面试题及参考答案

1.请简述数据仓库建模中维度建模与范式建模的核心差异,结合实际场景说明各自适用场景。

维度建模以分析需求为导向,采用星型或雪花型结构,通过维度表和事实表组织数据。维度表存储描述性信息(如时间、地区、商品),事实表存储量化指标(如销售额、订单量)。其核心是“面向主题、反范式”,通过冗余存储提升查询效率。例如电商大促期间,需要快速分析不同地区、时间段的销售情况,维度建模可通过维度表关联快速聚合,满足实时查询需求。

范式建模(第三范式)以数据存储效率为核心,通过消除数据冗余、确保数据一致性来设计表结构,通常用于OLTP系统。例如银行客户信息管理系统,需频繁更新客户地址、联系方式,范式建模通过拆分客户表、地址表,避免重复存储,减少更新异常。两者差异本质在于目标不同:维度建模服务分析(OLAP),允许适当冗余换查询性能;范式建模服务事务(OLTP),通过高内聚低耦合保证数据一致性。

2.数仓分层设计中,ODS层与DWD层的核心设计原则是什么?如何处理ODS层到DWD层的数据清洗与标准化?

ODS(操作数据存储)层设计原则:完整保留原始数据,包括业务系统的全量或增量数据,保持与源系统一致的结构(如字段类型、命名),记录数据的时间戳(如采集时间、业务时间),支持数据可追溯。例如电商订单ODS表需保留原始的“订单状态”枚举值(如1=未支付、2=已

文档评论(0)

1亿VIP精品文档

相关文档