- 4
- 0
- 约1.79万字
- 约 58页
- 2026-04-03 发布于广东
- 举报
大数据工程技术人员考试题库及答案
一、单选题
1.大数据处理中,Hadoop的核心组件是?
A.HDFS和MapReduce
B.HDFS和Hive
C.HBase和ZooKeeper
D.Kafka和Spark
答案:A
解析:Hadoop的核心组件包括分布式文件系统HDFS和计算框架MapReduce。
2.下列哪种数据存储方式适合实时查询?
A.HDFS
B.HBase
C.Hive
D.Pig
答案:B
解析:HBase是一个分布式的、面向列的数据库,适合实时读写操作。
3.在Hadoop中,NameNode的主要作用是?
A.存储数据块
B.管理文件系统的命名空间和访问权限
C.执行MapReduce任务
D.提供数据备份
答案:B
解析:NameNode负责管理文件系统的元数据,如文件目录结构和块的位置信息。
4.下列哪项不是Hadoop的特性?
A.高容错性
B.可扩展性
C.实时处理
D.分布式存储
答案:C
解析:Hadoop主要用于批处理,不支持实时处理。
5.Spark的核心概念是?
A.RDD
B.DataFrame
C.Dataset
D.GraphX
答案:A
解析:RDD(弹性分布式数据集)是Spark的核心数据结构,用于分布式计算。
6.下列哪项技术主要用于日志收集?
A.Kafka
B.Flume
C.Hive
D.Pig
答案:B
解析:Flum
原创力文档

文档评论(0)