2026年大数据分析师职业技能考核试题库.docxVIP

  • 3
  • 0
  • 约2.05万字
  • 约 29页
  • 2026-06-16 发布于湖北
  • 举报

2026年大数据分析师职业技能考核试题库.docx

2026年大数据分析师职业技能考核试题库

考试时间:______分钟总分:______分姓名:______

一、选择题(请选出最符合题意的选项)

1.下列哪种数据存储格式最适合存储结构化数据,并支持类SQL查询?

A.Avro

B.Parquet

C.ORC

D.JSON

2.在Hadoop生态系统中,负责管理集群资源和运行应用程序作业的组件是?

A.HDFS

B.YARN

C.MapReduce

D.Hive

3.以下哪个组件是ApacheSpark的核心,提供了分布式数据集(RDD)的抽象?

A.SparkSQL

B.SparkStreaming

C.MLlib

D.RDD

4.适用于处理大规模数据集,且具备容错性和高吞吐量的分布式文件系统是?

A.NAS

B.NFS

C.HDFS

D.S3

5.下列关于MapReduce编程模型的说法中,错误的是?

A.Map阶段负责读取输入数据并进行初步处理。

B.Reduce阶段负责对Map阶段的输出进行汇总或聚合。

C.Map和Reduce阶段的任务可以在任意顺序执行。

D.MapReduce模型

文档评论(0)

1亿VIP精品文档

相关文档