2025年云南省大数据公司通用笔试题库附完整答案解析.doc

2025年云南省大数据公司通用笔试题库附完整答案解析.doc

2025年云南省大数据公司通用笔试题库附完整答案解析

一、单项选择题,(总共10题,每题2分)

1.在Hadoop生态中,负责资源管理与任务调度的核心组件是

A.Hive?B.HDFS?C.YARN?D.Flume

2.下列哪一项最能描述数据湖的核心特征

A.仅支持结构化数据?B.先建模后存储?C.原始数据“先存储后治理”?D.依赖星型模式

3.当使用SparkSQL进行ETL时,为尽可能避免数据倾斜,应优先选择的操作是

A.repartitionByRange?B.coalesce(1)?C.cache?D.collect

4.在

文档评论(0)

1亿VIP精品文档

相关文档