- 2
- 0
- 约4.85千字
- 约 8页
- 2026-05-18 发布于河北
- 举报
2025年大数据工程师职业资格考试模拟卷
考试时间:______分钟总分:______分姓名:______
一、选择题(每题2分,共20分)
1.下列哪一项不属于大数据的“5V”特征?
A.Volume(海量)
B.Velocity(高速)
C.Variety(多样)
D.Validity(有效性)
2.HDFS架构中,NameNode的主要职责是?
A.存储数据的元数据
B.直接管理数据块的读写
C.负责整个集群的内存管理
D.管理DataNode的启动和停止
3.MapReduce模型中,Map阶段的输出键值对(K1,V1)在Reduce阶段如何被处理?
A.直接作为Reduce函数的输入
B.必须经过Shuffle和Sort过程
C.只在Map阶段使用,Reduce阶段不涉及
D.由Driver程序统一处理
4.以下哪种技术不是常用的数据清洗方法?
A.数据格式转换
B.缺失值处理
C.数据类型转换
D.特征选择
5.Spark中,RDD的持久化(Persist)与缓存(Cache)的主要区别在于?
A.持久化支持更多种类的存储后端
B.缓存只能持久化在内存中
原创力文档

文档评论(0)