大数据工程技术人员理论考试复习题库及答案.docxVIP

  • 2
  • 0
  • 约1.14万字
  • 约 29页
  • 2026-05-20 发布于未知
  • 举报

大数据工程技术人员理论考试复习题库及答案.docx

大数据工程技术人员理论考试复习题库及答案

一、单项选择题(每题2分,共20题)

1.以下关于Flume数据采集的描述中,错误的是()。

A.Flume的Event由Header和Body组成

B.Channel是数据的暂存区,支持MemoryChannel和FileChannel

C.Sink的作用是将数据从Channel输出到目标存储系统

D.Source只能接收来自Kafka的消息

答案:D(Flume的Source支持多种类型,如Avro、Thrift、HTTP、Kafka等,并非只能接收Kafka消息)

2.HDFS中默认的Block大小是()。

A.32MB

B.64MB

C.128MB

D.256MB

答案:C(HDFS2.x及以上版本默认Block大小为128MB,设计目的是减少NameNode内存占用并提升大文件读写效率)

3.SparkRDD的Transformation操作中,属于宽依赖的是()。

A.map()

B.filter()

C.groupByKey()

D.flatMap()

答案:C(宽依赖会触发Shuffle操作,groupByKey需要将相同Key的数据分发到同一分区,属于宽依赖;其他选项为窄依赖)

4.HBase中,RowK

文档评论(0)

1亿VIP精品文档

相关文档