2025年机器学习工程师考试题库(附答案和详细解析)(1217).docxVIP

  • 0
  • 0
  • 约9.58千字
  • 约 12页
  • 2026-02-06 发布于江苏
  • 举报

2025年机器学习工程师考试题库(附答案和详细解析)(1217).docx

机器学习工程师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪项是监督学习的典型特征?

A.输入数据无标签

B.目标是发现数据内在结构

C.需要输入-标签对数据训练

D.通过奖励信号优化策略

答案:C

解析:监督学习的核心是使用带标签的数据(输入-标签对)训练模型,目标是学习输入到标签的映射关系(如分类、回归)。A是无监督学习特征(如聚类),B是无监督学习目标,D是强化学习特征(如游戏AI)。

逻辑回归模型中,交叉熵损失函数的作用是?

A.衡量预测值与真实值的绝对误差

B.最小化模型参数的L2范数

C.最大化正确类别的概率似然

D.优化特征的线性组合系数

答案:C

解析:交叉熵损失通过最小化预测概率与真实标签的熵差,等价于最大化正确类别的对数似然(对数似然的负数即交叉熵)。A是MAE(平均绝对误差)的作用,B是L2正则化的目标,D是线性模型参数优化的通用描述,未特指损失函数。

以下哪种情况最可能表示模型发生了过拟合?

A.训练集准确率75%,验证集准确率70%

B.训练集准确率95%,验证集准确率60%

C.训练集准确率60%,验证集准确率65%

D.训练集和验证集准确率均为80%

答案:B

解析:过拟合的典型表现是模型在训练集上表现优异(高准确率),但在未见过的验证集上性能显著下降(泛化能力差)。A属于正常波动,C可能是欠拟合后通过验证集调参改善,D是理想的泛化状态。

评估分类模型时,F1分数综合了哪两个指标?

A.准确率与召回率

B.精确率与准确率

C.精确率与召回率

D.召回率与AUC

答案:C

解析:F1分数是精确率(Precision)和召回率(Recall)的调和平均,公式为(F1=2),用于平衡两者的重要性。准确率是总体正确比例,AUC是ROC曲线下面积,均不直接参与F1计算。

L2正则化(权重衰减)的主要目的是?

A.减少模型的偏差

B.防止特征维度过高

C.限制模型参数的大小

D.加速梯度下降收敛

答案:C

解析:L2正则化通过在损失函数中添加(w^2)项,惩罚大的权重参数,迫使模型选择更平滑的参数(避免过拟合)。A是增加模型复杂度的目标(如减少欠拟合),B是特征选择的作用,D是学习率或优化器(如Momentum)的作用。

特征工程中,“独热编码(One-HotEncoding)”主要用于处理哪种类型的数据?

A.连续数值特征

B.高基数类别特征

C.低基数类别特征

D.文本序列特征

答案:C

解析:独热编码将类别特征转换为二进制向量(每个类别对应一个维度),适用于低基数(类别数少)的类别特征(如“性别:男/女”)。高基数特征(如“城市”有1000个类别)使用独热编码会导致维度爆炸,通常用嵌入或目标编码;连续特征用归一化,文本用词向量。

在模型选择中,“留出法(Hold-Out)”与“交叉验证(CV)”的主要区别是?

A.留出法需要划分训练集和测试集,CV不需要

B.CV通过多次划分减少评估方差,留出法依赖单次划分

C.留出法适用于小数据集,CV适用于大数据集

D.CV仅用于分类任务,留出法无限制

答案:B

解析:留出法将数据单次划分为训练集和验证集,结果可能受随机划分影响(方差大);交叉验证(如10折CV)将数据多次划分并取平均,评估结果更稳定。A错误,CV也需要划分;C错误,留出法更适合大数据集(因CV计算成本高);D错误,两者适用任务相同。

以下哪种梯度下降方法计算效率最高?

A.批量梯度下降(BGD)

B.随机梯度下降(SGD)

C.小批量梯度下降(MBGD)

D.全量梯度下降(FGD)

答案:B

解析:SGD每次仅用1个样本计算梯度,更新速度最快(但波动大);BGD用全部样本(计算量大),MBGD用部分样本(平衡速度与稳定性)。FGD是BGD的别称,故效率最高的是SGD。

随机森林(RandomForest)属于哪种集成学习方法?

A.Bagging

B.Boosting

C.Stacking

D.Blending

答案:A

解析:随机森林通过自助采样(Bootstrap)生成多个决策树(基模型),并对预测结果投票(分类)或平均(回归),是典型的Bagging(自助聚合)方法。Boosting(如XGBoost)是串行训练基模型,纠正前序错误;Stacking是用元模型融合基模型输出。

卷积神经网络(CNN)中,池化层(Pooling)的主要作用是?

A.增加特征图的深度

B.减少空间维度(降维)

C.学习平移不变性特征

D.增强特征的非线性表达

答案:B

解析:池化层(如最大池化)通过下采样(如2x2窗口步长2)减少特征图的宽度和高度,降低计算量并保留主要特征。A是卷积层的作用(

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档