2023云南大数据公司内部员工笔试复习题附答案.docVIP

  • 2
  • 0
  • 约3.7千字
  • 约 7页
  • 2026-05-18 发布于北京
  • 举报

2023云南大数据公司内部员工笔试复习题附答案.doc

2023云南大数据公司内部员工笔试复习题附答案

一、单项选择题(每题2分,共20分)

1.在Hadoop生态中,负责集群资源管理与任务调度的核心组件是

A.Hive?B.YARN?C.HBase?D.Flume

2.下列哪项技术最常被用来解决“数据倾斜”导致的Reduce端长尾问题

A.增加Map数?B.两阶段聚合(Combiner)?C.提高副本因子?D.使用Snappy压缩

3.在Kafka0.10之后,消费者偏移量默认保存在哪个内部topic

A.__consumer_offsets?B.__offset_manager?C.__meta?D.__commit_log

4.若一张Hive表以ORC格式存储并开启事务,以下哪种操作无法通过SQL直接完成

A.UPDATE?B.DELETE?C.INSERTOVERWRITEDIRECTORY?D.MERGE

5.Spark中,以下哪一类操作会触发Job的提交

A.map?B.filter?C.reduceByKey?D.persist

6.在Flink的Checkpoint机制里,用于在故障恢复时保证“恰好一次”语义的屏障是

A.RecordBarrier?B.CheckpointBarrier?C.Waterma

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档