2026年大数据工程师职业资格考试题库(附答案和详细解析)(0204).docxVIP

  • 0
  • 0
  • 约7.84千字
  • 约 10页
  • 2026-03-17 发布于上海
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0204).docx

大数据工程师职业资格考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下关于HDFS默认块大小的描述,正确的是()

A.32MB

B.64MB

C.128MB

D.256MB

答案:C

解析:HDFS默认块大小为128MB(Hadoop2.x及以上版本),设计目的是减少NameNode内存占用并优化大文件处理效率。选项A(32MB)是Hadoop1.x早期版本的默认值;B(64MB)为Hadoop1.x后期版本默认值;D(256MB)为用户可配置的常见调整值,但非默认。

SparkRDD的核心特性不包括()

A.不可变性

B.惰性计算

C.强类型约束

D.弹性分布式

答案:C

解析:RDD(弹性分布式数据集)的核心特性包括不可变性(数据生成后不可修改)、惰性计算(转换操作不立即执行)、弹性(自动容错、分区重算)和分布式(跨集群存储)。强类型约束是Scala语言特性,非RDD核心属性。

以下哪种场景最适合使用Kafka?()

A.历史日志离线分析

B.实时数据流传输与缓冲

C.结构化数据查询

D.大规模图计算

答案:B

解析:Kafka是分布式流处理平台,核心场景是高吞吐量、低延迟的实时数据流传输(如日志收集、用户行为追踪)。A(离线分析)适合Hive/Spark;C(结构化查询)适合HBase/ClickHouse;D(图计算)适合G

文档评论(0)

1亿VIP精品文档

相关文档