大数据面试题及答案.pdfVIP

  • 1
  • 0
  • 约7.23千字
  • 约 15页
  • 2026-03-06 发布于河南
  • 举报

大数据面试题及答案

考试时长:120分钟满分:100分

试卷名称:大数据面试题及答案

考核对象:大数据行业从业者、求职者

题型分值分布:

-判断题(10题,每题2分)总分20分

-单选题(10题,每题2分)总分20分

-多选题(10题,每题2分)总分20分

-案例分析(3题,每题6分)总分18分

-论述题(2题,每题11分)总分22分

总分:100分

一、判断题(每题2分,共20分)

1.Hadoop生态系统中的HDFS是分布式文件系统,其设计目

标是高吞吐量而非低延迟访问。

2.MapReduce编程模型中,Map阶段的输出必须严格遵循“键

-值”对格式,Reduce阶段才能正确处理。

3.K-Means聚类算法对初始聚类中心的选择敏感,可能导致

收敛到局部最优解。

4.Spark的RDD(弹性分布式数据集)是不可变的,但可以通

过持久化机制优化计算性能。

5.机器学习中的过拟合是指模型在训练数据上表现极好,但

在测试数据上泛化能力差。

6.ETL(Extract-Tr

文档评论(0)

1亿VIP精品文档

相关文档