(2025年)万字数据仓库面试题及参考答案.docxVIP

  • 1
  • 0
  • 约6.94千字
  • 约 18页
  • 2026-05-09 发布于四川
  • 举报

(2025年)万字数据仓库面试题及参考答案.docx

(2025年)万字数据仓库面试题及参考答案

一、数据仓库基础概念

1.什么是数据仓库?

数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。面向主题意味着数据是围绕业务主题进行组织的,如客户、产品等;集成表示将来自不同数据源的数据进行整合和统一;相对稳定指数据一旦进入数据仓库,一般不会被随意修改;反映历史变化则能记录数据随时间的演变。

2.数据仓库与数据库的区别有哪些?

目的:数据库主要用于事务处理,支持日常业务操作,如订单录入、客户信息修改等;数据仓库用于数据分析和决策支持,帮助企业管理层进行战略规划和业务分析。

数据特性:数据库中的数据是实时的、易变的,经常会被更新和删除;数据仓库的数据是相对稳定的,主要用于历史数据的存储和分析。

数据组织:数据库按照业务流程进行数据组织,数据结构较为复杂;数据仓库按照主题进行数据组织,结构相对简单清晰。

使用人员:数据库主要由业务人员使用;数据仓库主要由数据分析人员、管理人员使用。

3.简述数据仓库的体系结构

数据仓库的体系结构通常包括数据源、数据抽取、转换和加载(ETL)、数据存储与管理、数据分析与挖掘、数据展现等部分。

数据源:可以是各种类型的数据库、文件系统、日志文件等。

ETL:从数据源中抽取数据,进行清洗、转换和加载到数据仓库中。

数据存储与管理:采用数据仓库技术,如星型模型、雪花模型等进行数据存

文档评论(0)

1亿VIP精品文档

相关文档