- 1
- 0
- 约7.23千字
- 约 15页
- 2026-03-06 发布于河南
- 举报
大数据面试题及答案
考试时长:120分钟满分:100分
试卷名称:大数据面试题及答案
考核对象:大数据行业从业者、求职者
题型分值分布:
-判断题(10题,每题2分)总分20分
-单选题(10题,每题2分)总分20分
-多选题(10题,每题2分)总分20分
-案例分析(3题,每题6分)总分18分
-论述题(2题,每题11分)总分22分
总分:100分
一、判断题(每题2分,共20分)
1.Hadoop生态系统中的HDFS是分布式文件系统,其设计目
标是高吞吐量而非低延迟访问。
2.MapReduce编程模型中,Map阶段的输出必须严格遵循“键
-值”对格式,Reduce阶段才能正确处理。
3.K-Means聚类算法对初始聚类中心的选择敏感,可能导致
收敛到局部最优解。
4.Spark的RDD(弹性分布式数据集)是不可变的,但可以通
过持久化机制优化计算性能。
5.机器学习中的过拟合是指模型在训练数据上表现极好,但
在测试数据上泛化能力差。
6.ETL(Extract-Tr
原创力文档

文档评论(0)