- 0
- 0
- 约3.3千字
- 约 6页
- 2026-05-15 发布于北京
- 举报
2025云南大数据岗位笔试必考题型汇总附标准答案
一、单项选择题(每题2分,共20分)
1.在HDFS中,负责保存元数据的核心守护进程是
A.NodeManager?B.ResourceManager?C.NameNode?D.DataNode
2.下列哪种压缩格式支持切片且最适合MapReduce后续处理
A.Gzip?B.Bzip2?C.LZO?D.Snappy
3.SparkRDD的transform算子中,用于按Key重新分区的算子是
A.map?B.reduceByKey?C.repartition?D.coalesce
4.在Flink的时间语义中,事件时间是指
A.数据进入Flink的时间?B.算子开始计算的时间?C.数据在源系统产生的时间?D.数据被窗口触发的时间
5.Kafka保证分区有序性的核心机制是
A.消费者组再均衡?B.分区副本同步?C.分区内部按偏移量顺序写?D.日志压缩
6.在Hive中,用于将子查询结果直接插入本地文件系统的命令是
A.INSERTOVERWRITEDIRECTORY?B.EXPORTTABLE?C.LOADDATALOCAL?D.INSERTINTOVALUES
7.下列关于HBaseRegion分裂描
原创力文档

文档评论(0)