数据领域面试题试题集解析.pdfVIP

  • 1
  • 0
  • 约2.39万字
  • 约 33页
  • 2026-03-06 发布于河南
  • 举报

数据领域面试题试题集解析

面试问答题(共20题)

第一题

请解释术语“维表(DimensionTable)”在数据仓库(DataWarehouse)中的含义,

并说明它在星型模型(StarSchema)或雪花模型(SnowflakeSchema)中扮演的角色

和作用。

答案:

维表(DimensionTable):

维表是数据仓库中的一种核心表,它存储与业务度量(Metrics)相关的描述性背

景信息或上下文。维度的本质是回答“谁(Who)、什么(What)、何时(When)、何地(Where)、

为何(Why)”等问题。维表通常包含分类或描述性的数据,用以elapsedTime限或

breakdown业务数据。例如,在销售场景中,日期维表存储了年、季、月、日等信息,

顾客维表存储了顾客ID、姓名、性别、年龄段等,产品维表存储了产品ID、名称、类

别、颜色等信息。

在星型模型和雪花模型中的作用:

维表在两种模型中都扮演着关键的描述性角色,但具体的实现方式和优缺点有所不

同:

•在星型模型(StarSchema)中:

•角色:维表是星型模型中的“角点”(Corners),直接与一个或多个事实表(Fact

Table)相关联。它们作为连接事实表和业务领域概念的桥梁。

•作用:

1.提供分析和报告所需的多维视角。用户可以通过对维表进行切片、切块(Slice

andDice)来对事实表中的度量数据进行分组和汇总。

2.方便数据的语义理解和业务用户的使用。维表的命名通常具有明显的业务含义。

3.支持快速查询。由于维表通常经过规范化,且只有一个事实表与之连接,查询优

化器更容易生成高效的执行计划。

4.维表通常存储在数据仓库的边缘(Leaves),与事实表物理上分开,与中心事实

表之间是多对一的关系。

•在雪花模型(SnowflakeSchema)中:

•角色:维表不仅连接事实表,而且还可能进一步规范化。例如,一个汇总的日

期维度可以有多个更细分的子维度(如新冠疫苗的日期CertaintySubsetTable、

季节性季节性DateSeasonalityTable等)连接到事实表。这种细化导致维表

本身形成一个类似雪花的层次结构。

•作用:

1.继续提供描述性背景信息。

2.在某些情况下可以减少重复数据(如在一个维度内部,某个属性可能被重复写入

多个记录,通过细分维度可以避免)。

3.可能导致更复杂的数据结构和查询路径,因为需要连接更多的中间维度表。

4.查询响应时间可能相对星型模型要慢一些,因为需要跨越更多的表和连接。

总结:无论在哪种模型中,维表的核心作用都是提供业务上下文,使得对存储在

事实表中的量化度量数据进行语义丰富的分析成为可能。星型模型倾向于使用较少、较

大的维表以提高查询效率,而雪花模型则倾向于使用更多、更细分的维表以减少数据冗

余,但可能牺牲一些查询性能。

解析:

1.定义准确:答案首先明确了维表的定义,强调其存储描述性信息、回答业务问

题(谁、什么、何时等)的角色,并举例说明(如日期、顾客、产品维表)。

2.区分星型与雪花模型:答案详细说明了维表在两种不同数据模型中的具体角色

和区别。对于星型模型,解释了它是角点,与事实表直接连接,有利于快速查询

和用户理解。对于雪花模型,解释了维表可能被进一步规范化,形成层次结构,

这有助于减少冗余,但也增加了复杂性和可能的查询延迟。

3.阐述作用:答案清晰阐述了维表的关键作用,如提供多维视角、方便语义理解、

支持切片切块分析,以及在星型模型中的查询优化优势。

4.结构清晰:答案结构合理,先定义,再分模型解释,最后总结,逻辑清晰易于

理解。

5.术语恰当:使用了数据仓库领域的常用术语,如事实表(FactTable)、星型模

型(StarSchema)、雪花模型(SnowflakeSchema)、切片切块(SliceandDice)、

查询优化器(QueryOptimizer)等。

这道题考察了对数据仓库基本

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档