- 0
- 0
- 约9.96千字
- 约 13页
- 2026-05-21 发布于河北
- 举报
2025年大数据工程师最新模拟题
考试时间:______分钟总分:______分姓名:______
一、选择题(每题2分,共20分)
1.下列哪一项不属于大数据的“5V”特征?
A.数据体量巨大(Volume)
B.数据类型多样(Variety)
C.数据价值密度高(Value)
D.数据生成速度快(Velocity)
E.数据准确性高(Veracity)
2.在Hadoop生态系统中,负责管理集群资源并为应用程序提供服务的组件是?
A.HDFS
B.MapReduce
C.YARN
D.Hive
3.以下哪个接口是SparkSQL中用于分布式数据集的核心抽象?
A.RDD
B.DataFrame
C.Dataset
D.SchemaRDD
4.与传统的批处理框架相比,实时计算框架(如Flink,SparkStreaming)的主要优势之一是?
A.更低的容错能力
B.更高的数据存储成本
C.更低的延迟和事件驱动处理
D.更复杂的编程模型
5.下列哪种技术架构通常被称为“湖仓一体”?
A.将所有数据存储在关系型数据库中
B.将结构化数据存储在数据仓库,
原创力文档

文档评论(0)