2025年数据仓库面试题附答案.docxVIP

  • 2
  • 0
  • 约4.93千字
  • 约 12页
  • 2026-05-07 发布于四川
  • 举报

2025年数据仓库面试题附答案

基础概念类

1.什么是数据仓库?

数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。面向主题意味着数据仓库围绕企业的核心业务主题进行组织,如客户、产品、销售等;集成是指将来自多个数据源的数据进行整合和统一;相对稳定表示数据一旦进入数据仓库,一般不会随意修改;反映历史变化则允许对数据的历史情况进行分析和研究。

答案:数据仓库是面向主题、集成、相对稳定且反映历史变化的数据集合,用于支持管理决策。

2.数据仓库与数据库的区别是什么?

数据库主要用于事务处理,是面向应用的,数据是实时更新的,设计目标是高效地处理日常的业务交易,数据结构较为复杂,通常采用规范化设计以减少数据冗余。而数据仓库用于数据分析和决策支持,是面向主题的,数据更新通常是定期进行的,设计目标是提供全面、准确的历史数据,数据结构相对简单,可能采用非规范化设计以提高查询性能。

答案:数据库面向应用,用于事务处理,实时更新,结构复杂且规范化;数据仓库面向主题,用于决策支持,定期更新,结构相对简单,可能非规范化。

3.什么是ETL?它在数据仓库中有什么作用?

ETL即Extract(抽取)、Transform(转换)、Load(加载)。抽取是从各种数据源中提取数据;转换是对抽取的数据进行清洗、转换、集成等操作,如去除重复数据、统一数据格式等;加载是将转换后

文档评论(0)

1亿VIP精品文档

相关文档