2026年机器学习工程师考试题库(附答案和详细解析)(0120).docxVIP

  • 0
  • 0
  • 约8.21千字
  • 约 12页
  • 2026-03-11 发布于江苏
  • 举报

2026年机器学习工程师考试题库(附答案和详细解析)(0120).docx

机器学习工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪项是监督学习的典型特征?

A.训练数据无标签

B.需要标注的训练数据

C.通过奖励信号优化策略

D.目标是发现数据内在结构

答案:B

解析:监督学习的核心是使用带标签的训练数据(输入x和输出y)来学习输入到输出的映射函数。选项A是无监督学习的特征,C是强化学习的特征,D是无监督学习(如聚类)的目标,因此正确答案为B。

以下哪种算法属于生成式模型?

A.逻辑回归

B.支持向量机(SVM)

C.朴素贝叶斯

D.决策树

答案:C

解析:生成式模型通过学习数据的联合概率分布P(x,y)来建模(如朴素贝叶斯假设特征独立,计算P(x|y)和P(y)),而判别式模型直接学习条件概率P(y|x)(如逻辑回归、SVM、决策树)。因此正确答案为C。

以下哪个指标最适合评估类别不平衡的分类任务?

A.准确率(Accuracy)

B.F1值

C.均方误差(MSE)

D.R方(R2)

答案:B

解析:类别不平衡时,准确率会因多数类主导而失效(如99%负样本时,全猜负样本准确率99%但无意义)。F1值综合了精确率和召回率,更适合评估不平衡数据。C、D是回归任务指标,故正确答案为B。

下列哪项操作会增加模型的方差?

A.增加正则化系数

B.减少训练数据量

C.降低模型复杂度

D.使用早停法(EarlyStopping)

答案:B

解析:方差反映模型对训练数据波动的敏感程度。数据量减少会导致模型更易过拟合(高方差);A、C、D均为降低方差的方法(正则化抑制过拟合,降低复杂度减少模型灵活性,早停防止训练过度)。故正确答案为B。

梯度下降中“批量”(Batch)指的是:

A.每次迭代使用全部训练数据计算梯度

B.每次迭代使用单个样本计算梯度

C.每次迭代使用小批量样本计算梯度

D.梯度更新的步长大小

答案:A

解析:批量梯度下降(BatchGD)每次用全部数据计算梯度(全局最优但计算慢),随机梯度下降(SGD)用单个样本(快但波动大),小批量(Mini-Batch)用部分样本(折中)。选项D是学习率的定义,故正确答案为A。

以下哪项不是K-means聚类的缺点?

A.对初始聚类中心敏感

B.需要预先指定聚类数K

C.无法处理非凸形状的簇

D.天然支持类别标签输出

答案:D

解析:K-means是无监督学习,输出的是样本所属的簇编号(无实际语义的标签),而非“天然支持类别标签输出”(这是监督学习的特点)。A、B、C均为K-means的典型缺点,故正确答案为D。

逻辑回归中使用sigmoid函数的主要目的是:

A.将线性输出映射到概率空间(0,1)

B.增加模型的非线性表达能力

C.解决多分类问题

D.降低计算复杂度

答案:A

解析:sigmoid函数将线性组合z=w·x+b映射到(0,1)区间,使其输出可解释为正类概率P(y=1|x)。逻辑回归本身是线性模型(B错误),多分类需扩展为Softmax(C错误),sigmoid不降低复杂度(D错误),故正确答案为A。

以下哪种方法不能缓解过拟合?

A.数据增强(DataAugmentation)

B.Dropout层

C.特征选择(FeatureSelection)

D.增加模型隐藏层神经元数量

答案:D

解析:过拟合的本质是模型复杂度过高。增加神经元数量会提升模型复杂度(更易过拟合);A(增加数据量)、B(随机失活降低复杂度)、C(减少冗余特征)均为缓解过拟合的方法。故正确答案为D。

评估回归模型时,RMSE(均方根误差)与MAE(平均绝对误差)的主要区别是:

A.RMSE对异常值更敏感

B.MAE计算更复杂

C.RMSE的量纲与原数据不一致

D.MAE更适合非对称误差分布

答案:A

解析:RMSE是MSE的平方根,因平方操作会放大异常值的影响;MAE直接取绝对差,对异常值更鲁棒。两者量纲均与原数据一致(C错误),MAE计算更简单(B错误),D无明确依据。故正确答案为A。

以下哪项是集成学习中“提升”(Boosting)方法的核心思想?

A.通过随机采样生成多个子模型,最终投票

B.关注前序模型错误样本,迭代优化

C.降低模型的偏差而非方差

D.仅适用于分类任务

答案:B

解析:Boosting(如Adaboost、XGBoost)通过迭代训练基模型,每轮重点关注前序模型预测错误的样本,最终通过加权投票集成。A是Bagging(如随机森林)的思想,C错误(Boosting同时降低偏差和方差),D错误(Boosting也可用于回归)。故正确答案为B。

二、多项选择题(共10题,每题2分,共20分)

以下属于特征工程的步骤有:

A.缺失值填充(如用均值填充

文档评论(0)

1亿VIP精品文档

相关文档