- 1
- 0
- 约7.97千字
- 约 17页
- 2026-06-09 发布于湖北
- 举报
2026年大数据分析师职业技能等级考试押题卷
考试时间:______分钟总分:______分姓名:______
一、单项选择题(下列每题只有一个正确选项,请将正确选项的字母填在题干后的括号内。每题1分,共30分)
1.大数据通常指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,其具有的“4V”特征不包括以下哪一项?
A.Volume(海量性)
B.Velocity(高速性)
C.Variety(多样性)
D.Veracity(精确性)
2.Hadoop生态系统中的HDFS主要解决什么问题?
A.实时数据流处理
B.图数据存储与管理
C.大规模数据分布式存储
D.数据库事务管理
3.以下哪个组件是Spark核心计算引擎?
A.HDFS
B.YARN
C.SparkCore
D.Hive
4.下列关于MapReduce工作流程的描述,错误的是?
A.Map阶段对输入数据进行处理,输出键值对
B.Shuffle阶段负责排序和分组键值对
C.Reduce阶段对具有相同键的值集合进行处理
D.Map和Reduce阶段必须严格按顺序执行
5.以下哪种数据存储格式适合存储半结构化和非
原创力文档

文档评论(0)