数据仓库面试题及详细答案.docxVIP

  • 1
  • 0
  • 约9.17千字
  • 约 10页
  • 2026-05-29 发布于河北
  • 举报

数据仓库面试题及详细答案

一、基础概念题(入门必问,贴合实际工作场景)

1.请简要说明数据仓库和数据库的区别,结合实际工作说说什么时候用数据仓库,什么时候用数据库?

答案:核心区别不在于“存储数据”,而在于“用途和设计逻辑”,结合实际工作总结如下:

数据库(如MySQL、Oracle):核心用途是联机事务处理(OLTP),面向一线业务操作,比如电商的订单提交、用户注册、库存变更,要求响应速度快(毫秒级)、数据实时准确,支持高频的增删改查,设计上更注重单表性能和事务一致性,一般是面向业务模块(如订单库、用户库)设计,数据量相对较小(单库百万/千万级)。

数据仓库(如Hive、ClickHouse、Greenplum):核心用途是联机分析处理(OLAP),面向管理层决策、业务分析,比如月度销售额分析、用户画像分析、留存率统计,不要求实时响应(秒级/分钟级均可),主要支持查询、统计、聚合,设计上注重数据的整合性(把多个业务库的数据汇总)、层次性(分层建模),数据量极大(亿级/十亿级),支持多维度、跨模块分析。

实际工作场景:比如做“实时订单支付”,用数据库;做“近一年各区域销售趋势分析”,用数据仓库;数据库是“业务的记录者”,数据仓库是“分析的支撑者”。

2.什么是数据仓库的分层架构?为什么要分层?实际工作中你常用的分层是什么?

答案:数据仓库分层不是固定标准,核心是“分而治之”,

文档评论(0)

1亿VIP精品文档

相关文档