2026年算法工程师职业认证考试题库(附答案和详细解析)(0514).docxVIP

  • 2
  • 0
  • 约6.62千字
  • 约 7页
  • 2026-06-19 发布于上海
  • 举报

2026年算法工程师职业认证考试题库(附答案和详细解析)(0514).docx

算法工程师职业认证考试试卷

一、单项选择题(共10题,每题1分,共10分)

在机器学习中,如果一个模型在训练集上表现很好,但在测试集上表现很差,这通常被称为什么现象?A.过拟合B.欠拟合C.泛化能力差D.数据偏差答案:A解析:过拟合是指模型在训练数据上学习得过于彻底,甚至学习了噪声和细节,导致模型对新数据的适应性变差。训练集表现好但测试集表现差是过拟合的典型特征。欠拟合是指模型过于简单,无法捕捉数据的规律。

下列哪项技术主要用于提升神经网络在训练过程中的收敛速度?A.DropoutB.BatchNormalizationC.L1/L2正则化D.交叉熵损失函数答案:B解析:BatchNormalization(批归一化)通过标准化每一层的输入,使输入分布保持稳定,从而加速模型收敛。Dropout是防止过拟合,L1/L2是正则化手段,交叉熵是损失函数。

在分布式计算框架(如Spark)中,ReduceByKey操作执行前,必须执行的操作是?A.MapB.ShuffleC.PartitionD.Filter答案:B解析:ReduceByKey需要将相同key的数据通过网络传输到同一个节点上进行聚合,这个传输过程称为Shuffle。Map和Filter只是局部转换,不涉及跨节点数据分发。

关于Pyth

文档评论(0)

1亿VIP精品文档

相关文档