2026年机器学习工程师考试题库(附答案和详细解析)(0125).docxVIP

  • 1
  • 0
  • 约7.97千字
  • 约 11页
  • 2026-03-14 发布于上海
  • 举报

2026年机器学习工程师考试题库(附答案和详细解析)(0125).docx

机器学习工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪种学习方法需要标注的训练数据?

A.监督学习

B.无监督学习

C.半监督学习

D.强化学习

答案:A

解析:监督学习的核心是通过输入特征与对应的标签(标注数据)训练模型,如分类、回归任务;无监督学习(B)仅使用无标签数据(如聚类);半监督学习(C)使用少量标签+大量无标签数据;强化学习(D)通过环境反馈(奖励信号)学习策略,无需显式标签。

以下哪种算法通过最大化数据间隔来分类?

A.逻辑回归

B.支持向量机(SVM)

C.决策树

D.K近邻(KNN)

答案:B

解析:SVM的核心是寻找最大间隔超平面,将不同类别数据分开;逻辑回归(A)通过sigmoid函数拟合概率;决策树(C)通过特征划分构建树结构;KNN(D)基于近邻样本投票分类。

当模型在训练集上表现很好但测试集表现差时,可能发生了?

A.欠拟合

B.过拟合

C.方差偏差平衡

D.数据泄露

答案:B

解析:过拟合指模型过度学习训练数据的噪声和细节,导致泛化能力差(测试集效果差);欠拟合(A)是模型无法捕捉数据规律(训练集效果也差);方差偏差平衡(C)是模型优化目标;数据泄露(D)指测试数据参与训练,导致评估不准。

以下哪个指标最适合评估类别不平衡的分类任务?

A.准确率(Accuracy)

B.精确率(Precision)

C.F1分数

D.均方误差(MSE)

答案:C

解析:类别不平衡时,准确率(A)易受多数类主导(如99%负样本时,全预测负样本准确率99%但无意义);F1分数是精确率和召回率的调和平均,综合衡量少数类表现;精确率(B)仅关注正预测中的真实正例,未考虑漏检;MSE(D)用于回归任务。

以下哪种损失函数适用于多分类任务?

A.均方误差(MSE)

B.交叉熵损失(Cross-Entropy)

C.Hinge损失

D.绝对误差(MAE)

答案:B

解析:交叉熵损失(B)通过预测概率与真实标签的对数似然计算,适用于多分类(如softmax+交叉熵);MSE(A)和MAE(D)用于回归;Hinge损失(C)主要用于SVM的二分类。

特征工程中,“将年龄分为青年/中年/老年”属于?

A.特征提取

B.特征离散化

C.特征归一化

D.特征选择

答案:B

解析:特征离散化是将连续值划分为离散区间(如年龄分箱);特征提取(A)指从原始数据生成新特征(如图像像素转直方图);归一化(C)是缩放特征范围(如Min-Max归一化);特征选择(D)是筛选重要特征。

以下哪种梯度下降方法计算速度最快但收敛波动大?

A.批量梯度下降(BGD)

B.随机梯度下降(SGD)

C.小批量梯度下降(MBGD)

D.动量梯度下降(Momentum)

答案:B

解析:SGD每次仅用1个样本计算梯度,速度最快但噪声大(收敛波动);BGD(A)用全部样本,计算慢但收敛稳定;MBGD(C)折中;Momentum(D)是优化策略,非基础类型。

集成学习中,随机森林(RandomForest)属于?

A.Bagging

B.Boosting

C.Stacking

D.梯度提升树(GBDT)

答案:A

解析:随机森林通过自助采样(Bootstrap)生成多个决策树(基模型),并行训练后投票(Bagging方法);Boosting(B)是串行训练(如AdaBoost);Stacking(C)是模型融合;GBDT(D)是Boosting的一种。

神经网络中,ReLU激活函数的主要优点是?

A.避免梯度消失

B.输出值在[-1,1]

C.计算复杂度高

D.适用于所有层

答案:A

解析:ReLU(f(x)=max(0,x))在x0时梯度为1,避免了Sigmoid/Tanh的梯度消失问题;输出值范围是[0,∞)(B错误);计算简单(C错误);通常用于隐藏层,输出层可能用Sigmoid/Softmax(D错误)。

超参数调优时,以下哪种方法效率最高?

A.网格搜索(GridSearch)

B.随机搜索(RandomSearch)

C.贝叶斯优化(BayesianOptimization)

D.手动调参

答案:C

解析:贝叶斯优化通过概率模型(如高斯过程)建模超参数与目标函数的关系,优先探索更有潜力的区域,效率高于网格(A,穷举所有组合)和随机搜索(B,随机采样);手动调参(D)依赖经验,效率最低。

二、多项选择题(共10题,每题2分,共20分)

以下属于无监督学习任务的有?

A.K-means聚类

B.主成分分析(PCA)

C.逻辑回归

D.关联规则挖掘(Apriori)

答案:ABD

解析:无监督学习无标签数据,K-means(A)聚类、PCA(B

文档评论(0)

1亿VIP精品文档

相关文档