2025年云南省大数据公司通用笔试题库附完整答案解析
一、单项选择题,(总共10题,每题2分)
1.在Hadoop生态中,负责资源管理与任务调度的核心组件是
A.Hive?B.HDFS?C.YARN?D.Flume
2.下列哪一项最能描述数据湖的核心特征
A.仅支持结构化数据?B.先建模后存储?C.原始数据“先存储后治理”?D.依赖星型模式
3.当使用SparkSQL进行ETL时,为尽可能避免数据倾斜,应优先选择的操作是
A.repartitionByRange?B.coalesce(1)?C.cache?D.collect
4.在
原创力文档

文档评论(0)