- 2
- 0
- 约9.55千字
- 约 14页
- 2026-06-06 发布于湖北
- 举报
2026年大数据分析师职业技能等级考试全真模拟试题集
考试时间:______分钟总分:______分姓名:______
一、选择题(每题只有一个正确选项,请将正确选项字母填在题干后的括号内)
1.在Hadoop生态系统中,负责分布式存储的海量、可靠、高吞吐量的数据文件系统的组件是?
A.MapReduce
B.Hive
C.YARN
D.HDFS
2.下列关于MapReduce作业执行过程的描述中,正确的是?
A.Map阶段完成后直接输出最终结果文件
B.Reduce阶段的输入是Map阶段输出的中间键值对集合
C.Map和Reduce阶段必须运行在同一个节点上
D.Shuffling和Sorting发生在Map阶段内部
3.Spark中,用于分布式存储大型数据集,支持高吞吐量随机读写的组件是?
A.SparkSQL
B.RDD
C.DataFrame
D.HBase
4.以下哪种技术不属于大数据的“4V”特征范畴?
A.Volume(海量性)
B.Velocity(高速性)
C.Veracity(真实性)
D.Variety(多样性)
5.在大数据处理流程中,数据清洗通常发生在哪个阶段
原创力文档

文档评论(0)