- 1
- 0
- 约6.94千字
- 约 18页
- 2026-05-09 发布于四川
- 举报
(2025年)万字数据仓库面试题及参考答案
一、数据仓库基础概念
1.什么是数据仓库?
数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。面向主题意味着数据是围绕业务主题进行组织的,如客户、产品等;集成表示将来自不同数据源的数据进行整合和统一;相对稳定指数据一旦进入数据仓库,一般不会被随意修改;反映历史变化则能记录数据随时间的演变。
2.数据仓库与数据库的区别有哪些?
目的:数据库主要用于事务处理,支持日常业务操作,如订单录入、客户信息修改等;数据仓库用于数据分析和决策支持,帮助企业管理层进行战略规划和业务分析。
数据特性:数据库中的数据是实时的、易变的,经常会被更新和删除;数据仓库的数据是相对稳定的,主要用于历史数据的存储和分析。
数据组织:数据库按照业务流程进行数据组织,数据结构较为复杂;数据仓库按照主题进行数据组织,结构相对简单清晰。
使用人员:数据库主要由业务人员使用;数据仓库主要由数据分析人员、管理人员使用。
3.简述数据仓库的体系结构
数据仓库的体系结构通常包括数据源、数据抽取、转换和加载(ETL)、数据存储与管理、数据分析与挖掘、数据展现等部分。
数据源:可以是各种类型的数据库、文件系统、日志文件等。
ETL:从数据源中抽取数据,进行清洗、转换和加载到数据仓库中。
数据存储与管理:采用数据仓库技术,如星型模型、雪花模型等进行数据存
原创力文档

文档评论(0)