2026年大数据分析师职业技能等级考试全真模拟试题集.docxVIP

  • 2
  • 0
  • 约9.55千字
  • 约 14页
  • 2026-06-06 发布于湖北
  • 举报

2026年大数据分析师职业技能等级考试全真模拟试题集.docx

2026年大数据分析师职业技能等级考试全真模拟试题集

考试时间:______分钟总分:______分姓名:______

一、选择题(每题只有一个正确选项,请将正确选项字母填在题干后的括号内)

1.在Hadoop生态系统中,负责分布式存储的海量、可靠、高吞吐量的数据文件系统的组件是?

A.MapReduce

B.Hive

C.YARN

D.HDFS

2.下列关于MapReduce作业执行过程的描述中,正确的是?

A.Map阶段完成后直接输出最终结果文件

B.Reduce阶段的输入是Map阶段输出的中间键值对集合

C.Map和Reduce阶段必须运行在同一个节点上

D.Shuffling和Sorting发生在Map阶段内部

3.Spark中,用于分布式存储大型数据集,支持高吞吐量随机读写的组件是?

A.SparkSQL

B.RDD

C.DataFrame

D.HBase

4.以下哪种技术不属于大数据的“4V”特征范畴?

A.Volume(海量性)

B.Velocity(高速性)

C.Veracity(真实性)

D.Variety(多样性)

5.在大数据处理流程中,数据清洗通常发生在哪个阶段

文档评论(0)

1亿VIP精品文档

相关文档