- 0
- 0
- 约3.89千字
- 约 11页
- 2026-03-25 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年大数据工程师招聘:专业面试题集
一、选择题(共10题,每题2分,共20分)
1.在Hadoop生态系统中,以下哪个组件主要用于分布式文件存储?
A.Hive
B.HDFS
C.YARN
D.Spark
2.以下哪种数据库最适合处理大规模数据集?
A.MySQL
B.PostgreSQL
C.MongoDB
D.Redis
3.在Spark中,以下哪个操作属于转换操作?
A.`filter()`
B.`collect()`
C.`map()`
D.`reduce()`
4.以下哪种算法通常用于数据聚类?
A.决策树
B.神经网络
C.K-means
D.KNN
5.在数据仓库设计中,星型模型通常包含多少个层次?
A.2
B.3
C.4
D.5
6.以下哪个工具主要用于数据可视化?
A.TensorFlow
B.Tableau
C.PyTorch
D.Pandas
7.在分布式计算中,以下哪个概念描述了任务被分成多个子任务并行处理?
A.数据并行
B.算法并行
C.资源并行
D.任务并行
8.以下哪种技术可以用于实时数据流处理?
A.MapReduce
B.SparkStreaming
C.Hive
D.HBase
9.在数据挖掘中,以下哪种方法
原创力文档

文档评论(0)