2025云南大数据岗位笔试必考题型汇总附标准答案.docVIP

  • 0
  • 0
  • 约3.3千字
  • 约 6页
  • 2026-05-15 发布于北京
  • 举报

2025云南大数据岗位笔试必考题型汇总附标准答案.doc

2025云南大数据岗位笔试必考题型汇总附标准答案

一、单项选择题(每题2分,共20分)

1.在HDFS中,负责保存元数据的核心守护进程是

A.NodeManager?B.ResourceManager?C.NameNode?D.DataNode

2.下列哪种压缩格式支持切片且最适合MapReduce后续处理

A.Gzip?B.Bzip2?C.LZO?D.Snappy

3.SparkRDD的transform算子中,用于按Key重新分区的算子是

A.map?B.reduceByKey?C.repartition?D.coalesce

4.在Flink的时间语义中,事件时间是指

A.数据进入Flink的时间?B.算子开始计算的时间?C.数据在源系统产生的时间?D.数据被窗口触发的时间

5.Kafka保证分区有序性的核心机制是

A.消费者组再均衡?B.分区副本同步?C.分区内部按偏移量顺序写?D.日志压缩

6.在Hive中,用于将子查询结果直接插入本地文件系统的命令是

A.INSERTOVERWRITEDIRECTORY?B.EXPORTTABLE?C.LOADDATALOCAL?D.INSERTINTOVALUES

7.下列关于HBaseRegion分裂描

文档评论(0)

1亿VIP精品文档

相关文档