2025年人工智能训练师三级理论(带答案).docxVIP

  • 0
  • 0
  • 约6.25千字
  • 约 16页
  • 2026-03-13 发布于四川
  • 举报

2025年人工智能训练师三级理论(带答案).docx

2025年人工智能训练师三级理论(带答案)

一、单项选择题(共15题,每题2分,共30分。每题只有一个正确选项)

1.以下哪项属于非结构化数据标注的典型场景?

A.图像中目标边界框标注

B.文本情感极性(正向/负向)标注

C.视频中关键帧时间点标注

D.表格数据中缺失值补全

2.在监督学习中,若训练集与测试集的划分未考虑数据分布一致性,最可能导致的问题是?

A.模型欠拟合

B.模型泛化能力差

C.计算复杂度增加

D.梯度消失

3.对于二分类任务,当正类样本占比仅5%时,以下最不适合的评估指标是?

A.准确率

B.F1值

C.ROCAUC

D.召回率

4.以下哪种数据增强方法不适用于文本数据?

A.同义词替换

B.随机插入句子

C.高斯模糊

D.回译(BackTranslation)

5.在神经网络训练中,使用BatchNormalization(BN)层的主要目的是?

A.减少过拟合

B.加速训练收敛

C.增加模型深度

D.降低计算量

6.若某分类模型的混淆矩阵如下(行:真实标签,列:预测标签),则模型的精确率(Precision)为?

||正类|负类|

||||

|正类|80|20|

|负类|10|90|

A.80%

B.88.89%

C.72.73%

D.90%

7.以下哪项不属于迁移学习的常见应用场景?

A.利用预训练的BERT模型微调完成文本分类

B.使用ImageNet预训练的ResNet模型初始化医学影像分类模型

C.基于小样本数据训练全新的卷积神经网络

D.通过领域自适应(DomainAdaptation)解决跨域目标检测问题

8.关于决策树剪枝,以下说法错误的是?

A.预剪枝通过限制树的深度或叶子节点最小样本数实现

B.后剪枝在完全生成决策树后删除冗余分支

C.剪枝的主要目的是降低模型复杂度,防止过拟合

D.剪枝会导致模型在训练集上的准确率显著提升

9.在强化学习中,“折扣因子(γ)”的取值范围通常是?

A.γ0

B.0≤γ1

C.1≤γ2

D.γ≥2

10.以下哪种损失函数最适合多分类任务(类别标签为互斥的)?

A.均方误差(MSE)

B.交叉熵损失(CrossEntropy)

C.Hinge损失

D.绝对误差(MAE)

11.某回归模型的R2值为0.85,说明?

A.模型能解释85%的因变量变异

B.模型预测误差的平方和为85%

C.模型在测试集上的准确率为85%

D.模型存在严重过拟合

12.以下哪项属于无监督学习任务?

A.垃圾邮件分类

B.客户分群(Clustering)

C.房价预测

D.图像目标检测

13.在自然语言处理中,词嵌入(WordEmbedding)的主要作用是?

A.将文本转换为固定长度的向量

B.增加文本的可读性

C.消除文本中的语法错误

D.统计词频分布

14.若训练数据中存在大量噪声标签(如错误标注的样本),最有效的解决方法是?

A.增加模型复杂度

B.使用交叉验证

C.进行数据清洗或重新标注

D.降低学习率

15.以下哪种优化器在训练初期通常具有较大的动量(Momentum)效应?

A.SGD(随机梯度下降)

B.Adam

C.RMSprop

D.Adagrad

二、多项选择题(共10题,每题3分,共30分。每题至少有2个正确选项,错选、漏选均不得分)

1.以下属于数据预处理步骤的有?

A.缺失值填充

B.特征标准化(Zscore)

C.标签编码(LabelEncoding)

D.模型超参数调整

2.过拟合的典型表现包括?

A.训练集准确率高,测试集准确率低

B.模型在简单数据上表现差

C.损失函数在训练集上持续下降,在验证集上先降后升

D.模型参数数量远小于训练样本量

3.以下哪些方法可用于解决类别不平衡问题?

A.对少数类进行过采样(Oversampling)

B.对多数类进行欠采样(Undersampling)

C.调整分类阈值(Threshold)

D.使用SMOTE算法生成合成样本

4.关于神经网络中的激活

文档评论(0)

1亿VIP精品文档

相关文档