2025年大数据试题及答案.docx

2025年大数据试题及答案

一、单项选择题(每题2分,共20分)

1.以下关于HDFS副本机制的描述中,错误的是()

A.默认副本数为3

B.第一个副本存储在客户端所在节点(若客户端不在集群中则随机选择)

C.第二个副本存储在与第一个副本不同的机架

D.第三个副本存储在与第二个副本相同的机架

2.Spark中,RDD的transformation操作是()

A.立即执行并提供结果

B.延迟执行,构建计算血缘

C.直接触发Shuffle过程

D.仅支持窄依赖操作

3.数据倾斜(DataSkew)的典型表现是()

A.任务执

文档评论(0)

1亿VIP精品文档

相关文档