2026年机器学习工程师考试题库（附答案和详细解析）（0106）.docxVIP

下载本文档

0
0
约7.47千字
约 11页
2026-01-28 发布于上海
举报

2026年机器学习工程师考试题库（附答案和详细解析）（0106）.docx

机器学习工程师考试试卷（总分100分）

一、单项选择题（共10题，每题1分，共10分）

逻辑回归模型常用的损失函数是以下哪一种？

A.均方误差（MSE）

B.合页损失（HingeLoss）

C.交叉熵损失（Cross-EntropyLoss）

D.指数损失（ExponentialLoss）

答案：C

解析：逻辑回归用于二分类任务，其目标是最小化预测概率与真实标签的对数损失（即交叉熵损失）。均方误差（A）通常用于回归任务；合页损失（B）是支持向量机（SVM）的损失函数；指数损失（D）是AdaBoost的损失函数。

以下哪种方法最常用于解决模型过拟合问题？

A.增加训练数据量

B.减少正则化参数λ

C.提高模型复杂度（如增加神经网络层数）

D.降低学习率

答案：A

解析：过拟合的本质是模型过度学习了训练数据的噪声，增加训练数据量（A）可以提升模型泛化能力。减少正则化参数λ（B）会削弱对模型复杂度的惩罚，加剧过拟合；提高模型复杂度（C）会进一步增加过拟合风险；降低学习率（D）主要影响优化收敛速度，与过拟合无直接关联。

随机梯度下降（SGD）与批量梯度下降（BGD）的核心区别是？

A.SGD使用全部训练样本计算梯度，BGD使用单个样本

B.SGD使用单个样本计算梯度，BGD使用全部样本

C.SGD的学习率固定，BGD的学习率动态调整

D.SGD无法收敛，BGD一定收敛

答案：B

解析：BGD每次迭代使用全部训练样本计算梯度（计算成本高但稳定），SGD每次仅用单个样本（计算快但噪声大）。学习率是否固定（C）与梯度下降类型无关；SGD在合适学习率下可收敛（D错误）。

在类别高度不平衡的分类任务中，最适合的评估指标是？

A.准确率（Accuracy）

B.F1分数（F1-Score）

C.均方误差（MSE）

D.R方值（R2）

答案：B

解析：类别不平衡时，准确率（A）会因多数类主导而失效；F1分数综合了精确率和召回率（B），更能反映模型对少数类的识别能力。均方误差（C）和R方值（D）是回归任务的评估指标。

支持向量机（SVM）中，“核函数”的主要作用是？

A.增加模型的线性可分性

B.将低维数据映射到高维空间，使其线性可分

C.减少计算复杂度

D.提高模型的可解释性

答案：B

解析：核函数通过非线性变换（如高斯核）将低维不可分数据映射到高维空间，使其在高维空间线性可分（B正确）。增加线性可分性（A）是映射后的结果而非核函数本质；核函数可能增加计算复杂度（C错误）；核函数会降低可解释性（D错误）。

决策树算法中，CART（分类与回归树）使用的分裂准则是？

A.信息增益（InformationGain）

B.信息增益比（GainRatio）

C.基尼系数（GiniImpurity）

D.均方误差（MSE）

答案：C

解析：CART算法在分类任务中使用基尼系数（C）衡量数据不纯度，回归任务中使用均方误差（D）。信息增益（A）是ID3算法的准则，信息增益比（B）是C4.5算法的准则。

神经网络中，ReLU激活函数的主要优点是？

A.解决梯度消失问题

B.输出值范围在[0,1]

C.计算复杂度高

D.适用于所有层的激活

答案：A

解析：ReLU（f(x)=max(0,x)）在输入为正时梯度为1，避免了Sigmoid/tanh激活函数在深层网络中的梯度消失问题（A正确）。输出范围（B）是Sigmoid的特性；ReLU计算简单（C错误）；输出层通常不用ReLU（D错误）。

以下哪项属于集成学习中的Bagging方法？

A.梯度提升树（GradientBoostingTree）

B.随机森林（RandomForest）

C.XGBoost

D.AdaBoost

答案：B

解析：Bagging通过Bootstrap抽样生成多个子模型并行训练（如随机森林，B正确）。Boosting方法（A、C、D）通过串行训练纠正前序模型的错误。

处理类别特征（如“性别：男/女”）时，最常用的编码方法是？

A.标签编码（LabelEncoding）

B.独热编码（One-HotEncoding）

C.标准化（Standardization）

D.归一化（Normalization）

答案：B

解析：类别特征无顺序关系时，独热编码（B）通过二进制向量避免模型错误学习顺序关系。标签编码（A）适用于有序类别（如“低/中/高”）；标准化/归一化（C、D）是数值特征的缩放方法。

模型出现过拟合时，训练集和验证集的表现通常是？

A.训练误差低，验证误差低

B.训练误差高，验证误差高

C.训练误差低，验证误差高

D.训练误差高，验证误差低

答案：C

解析：过拟合时模型过度拟合训练数

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2026年机器学习工程师考试题库（附答案和详细解析）（0106）.docxVIP