大数据工程技术人员考试题库及答案.docxVIP

  • 4
  • 0
  • 约1.79万字
  • 约 58页
  • 2026-04-03 发布于广东
  • 举报

大数据工程技术人员考试题库及答案.docx

大数据工程技术人员考试题库及答案

一、单选题

1.大数据处理中,Hadoop的核心组件是?

A.HDFS和MapReduce

B.HDFS和Hive

C.HBase和ZooKeeper

D.Kafka和Spark

答案:A

解析:Hadoop的核心组件包括分布式文件系统HDFS和计算框架MapReduce。

2.下列哪种数据存储方式适合实时查询?

A.HDFS

B.HBase

C.Hive

D.Pig

答案:B

解析:HBase是一个分布式的、面向列的数据库,适合实时读写操作。

3.在Hadoop中,NameNode的主要作用是?

A.存储数据块

B.管理文件系统的命名空间和访问权限

C.执行MapReduce任务

D.提供数据备份

答案:B

解析:NameNode负责管理文件系统的元数据,如文件目录结构和块的位置信息。

4.下列哪项不是Hadoop的特性?

A.高容错性

B.可扩展性

C.实时处理

D.分布式存储

答案:C

解析:Hadoop主要用于批处理,不支持实时处理。

5.Spark的核心概念是?

A.RDD

B.DataFrame

C.Dataset

D.GraphX

答案:A

解析:RDD(弹性分布式数据集)是Spark的核心数据结构,用于分布式计算。

6.下列哪项技术主要用于日志收集?

A.Kafka

B.Flume

C.Hive

D.Pig

答案:B

解析:Flum

文档评论(0)

1亿VIP精品文档

相关文档