大数据笔试题及答案.docxVIP

  • 1
  • 0
  • 约5.61千字
  • 约 6页
  • 2026-03-19 发布于河北
  • 举报

大数据笔试题及答案

一、选择题(每题3分,共30分)

1.下列不属于Hadoop核心组件的是()

A.HDFSB.MapReduceC.SparkD.YARN

2.关于HDFS的NameNode,以下说法错误的是()

A.存储文件元数据B.负责数据块的分配和管理C.存储实际数据块D.是HDFS的主节点

3.Spark中,哪个算子是宽依赖算子()

A.mapB.filterC.reduceByKeyD.flatMap

4.下列哪种数据模型是HBase采用的()

A.关系型B.键值对C.列族D.文档型

5.关于MapReduce的Shuffle阶段,以下描述正确的是()

A.只包含Map端的排序和合并B.只包含Reduce端的复制和归并C.包含Map端排序合并和Reduce端复制归并D.不涉及数据传输

6.大数据处理流程中,数据清洗的核心目的是()

A.提升数据存储效率B.去除无效、冗余数据,保证数据质量C.降低数据传输成本D.对数据进行脱敏处理

7.Kafka中,一个Topic可以被分为多个()

A.BrokerB.PartitionC.ConsumerGroupD.Producer

8.下列SQL

文档评论(0)

1亿VIP精品文档

相关文档