人工智能训练师考试题及答案.docxVIP

  • 1
  • 0
  • 约5.85千字
  • 约 16页
  • 2025-10-21 发布于四川
  • 举报

人工智能训练师考试题及答案

一、单项选择题(每题2分,共20分)

1.以下哪种数据标注类型适用于图像中多个不重叠目标的定位任务?

A.关键点标注

B.边界框标注

C.语义分割标注

D.实例分割标注

2.在神经网络训练中,若训练集损失持续下降但验证集损失先降后升,最可能的原因是?

A.学习率过低

B.模型欠拟合

C.模型过拟合

D.数据归一化错误

3.对于二分类任务,当正样本占比仅5%时,以下哪种评估指标最能反映模型对少数类的识别能力?

A.准确率(Accuracy)

B.F1值

C.精确率(Precision)

D.召回率(Recall)

4.以下哪项不属于数据增强在图像分类任务中的常用方法?

A.随机裁剪

B.椒盐噪声添加

C.词向量替换

D.颜色抖动

5.在自然语言处理(NLP)中,处理变长文本时通常采用的技术是?

A.填充(Padding)与截断(Truncation)

B.词频逆文档频率(TFIDF)

C.主成分分析(PCA)

D.局部敏感哈希(LSH)

6.以下哪种优化器结合了动量(Momentum)和自适应学习率(AdaptiveLearningRate)的特性?

A.SGD

B.RMSprop

C.Adam

D.Adagrad

7.若需训练一个识别手写数字的卷积神经网络(CNN),输入图像尺寸为28×28×1(单通道),第一个卷积层设置为3×3卷积核、步长1、padding=1,则输出特征图的尺寸为?

A.28×28

B.26×26

C.30×30

D.24×24

8.在迁移学习中,“冻结(Freeze)”预训练模型的前几层参数的主要目的是?

A.减少计算量

B.保留底层通用特征

C.避免梯度消失

D.增加模型复杂度

9.以下哪项是处理时间序列数据时循环神经网络(RNN)的主要缺陷?

A.无法处理变长序列

B.长距离依赖问题

C.参数量过大

D.不支持并行计算

10.人工智能伦理中“可解释性(Interpretability)”的核心要求是?

A.模型预测速度快

B.用户能理解模型决策依据

C.模型参数可公开

D.训练数据完全匿名

二、填空题(每空1分,共15分)

1.数据标注中,“为图像中的每个像素分配类别标签”的任务称为_________。

2.深度学习中,常用的激活函数_________能缓解梯度消失问题,其数学表达式为max(0,x)。

3.评估回归模型性能时,均方误差(MSE)的计算公式为_________(用符号表示)。

4.自然语言处理中,将文本转换为向量的常用方法包括_________(如Word2Vec)和_________(如BERT)。

5.卷积神经网络(CNN)中,_________层的作用是减少特征图尺寸并保留主要特征,常用的操作有最大池化和平均池化。

6.对抗样本攻击是指通过_________扰动输入数据,使模型做出错误预测的攻击方式。

7.强化学习的三要素是_________、_________和奖励函数。

8.在模型部署时,为降低计算资源消耗,常用的优化技术包括_________(如将32位浮点数转为16位)和_________(如剪枝冗余参数)。

9.处理类别不平衡数据时,除了数据层面的过采样(如SMOTE)和欠采样,模型层面的常用方法是_________(如调整交叉熵损失的类别权重)。

三、简答题(每题8分,共32分)

1.简述数据清洗的主要步骤及每一步的具体操作。

2.对比监督学习与无监督学习的核心区别,并各举一个典型应用场景。

3.说明训练神经网络时“早停法(EarlyStopping)”的实施策略及其原理。

4.什么是模型的“泛化能力”?如何通过验证集和测试集评估泛化能力?

四、应用题(每题10分,共20分)

1.某团队需训练一个识别“交通信号灯颜色(红/黄/绿)”的图像分类模型,提供的训练数据存在以下问题:

红灯样本占比70%,黄灯占比5%,绿灯占比25%;

部分图像因拍摄角度问题,信号灯区域仅占画面的10%;

所有图像均为晴天白天拍摄,无雨天、夜间场景。

请设计针对性的数据预处理和增强方案,以提升模型性能。

2.某公司的文本分类模型(输入为用户评论,输出为“好评/中评/差评”)在上线后出现以下问题:训练集准确率92

文档评论(0)

1亿VIP精品文档

相关文档