2025年最新继续教育公需科目大数据技术及应用题库及答案.docxVIP

  • 0
  • 0
  • 约1.38万字
  • 约 31页
  • 2026-03-05 发布于湖北
  • 举报

2025年最新继续教育公需科目大数据技术及应用题库及答案.docx

2025年最新继续教育公需科目大数据技术及应用题库及答案

一、单项选择题(每题1分,共30分)

1.在Hadoop生态中,负责资源管理与任务调度的核心组件是

A.HDFS??B.YARN??C.MapReduce??D.Hive

答案:B

解析:YARN(YetAnotherResourceNegotiator)是Hadoop2.x引入的资源管理系统,负责集群资源分配与作业调度,解耦了MapReduce的计算与资源管理功能。

2.下列哪一项最能描述Kafka的“日志压缩”机制?

A.删除过期消息??B.只保留每个Key最新值??C.压缩消息体大小??D.降低副本数量

答案:B

解析:日志压缩(LogCompaction)确保Topic中每个Key至少保留其最新一条记录,形成“快照”视图,适用于配置信息、用户画像等需要持久化最新状态的场景。

3.SparkSQL中,使用DataFrameAPI执行join操作时,默认采用哪种策略?

A.broadcasthashjoin??B.shufflesortmergejoin??C.shufflehashjoin??D.cartesianjoin

答案:B

解析:当两张表都较大且未显式hint时,SparkCatalyst优化器优先选择shuff

文档评论(0)

1亿VIP精品文档

相关文档