人工智能训练师考试题及答案.docxVIP

下载本文档

1
0
约5.85千字
约 16页
2025-10-21 发布于四川
举报

人工智能训练师考试题及答案.docx

人工智能训练师考试题及答案

一、单项选择题（每题2分，共20分）

1.以下哪种数据标注类型适用于图像中多个不重叠目标的定位任务？

A.关键点标注

B.边界框标注

C.语义分割标注

D.实例分割标注

2.在神经网络训练中，若训练集损失持续下降但验证集损失先降后升，最可能的原因是？

A.学习率过低

B.模型欠拟合

C.模型过拟合

D.数据归一化错误

3.对于二分类任务，当正样本占比仅5%时，以下哪种评估指标最能反映模型对少数类的识别能力？

A.准确率（Accuracy）

B.F1值

C.精确率（Precision）

D.召回率（Recall）

4.以下哪项不属于数据增强在图像分类任务中的常用方法？

A.随机裁剪

B.椒盐噪声添加

C.词向量替换

D.颜色抖动

5.在自然语言处理（NLP）中，处理变长文本时通常采用的技术是？

A.填充（Padding）与截断（Truncation）

B.词频逆文档频率（TFIDF）

C.主成分分析（PCA）

D.局部敏感哈希（LSH）

6.以下哪种优化器结合了动量（Momentum）和自适应学习率（AdaptiveLearningRate）的特性？

A.SGD

B.RMSprop

C.Adam

D.Adagrad

7.若需训练一个识别手写数字的卷积神经网络（CNN），输入图像尺寸为28×28×1（单通道），第一个卷积层设置为3×3卷积核、步长1、padding=1，则输出特征图的尺寸为？

A.28×28

B.26×26

C.30×30

D.24×24

8.在迁移学习中，“冻结（Freeze）”预训练模型的前几层参数的主要目的是？

A.减少计算量

B.保留底层通用特征

C.避免梯度消失

D.增加模型复杂度

9.以下哪项是处理时间序列数据时循环神经网络（RNN）的主要缺陷？

A.无法处理变长序列

B.长距离依赖问题

C.参数量过大

D.不支持并行计算

10.人工智能伦理中“可解释性（Interpretability）”的核心要求是？

A.模型预测速度快

B.用户能理解模型决策依据

C.模型参数可公开

D.训练数据完全匿名

二、填空题（每空1分，共15分）

1.数据标注中，“为图像中的每个像素分配类别标签”的任务称为_________。

2.深度学习中，常用的激活函数_________能缓解梯度消失问题，其数学表达式为max(0,x)。

3.评估回归模型性能时，均方误差（MSE）的计算公式为_________（用符号表示）。

4.自然语言处理中，将文本转换为向量的常用方法包括_________（如Word2Vec）和_________（如BERT）。

5.卷积神经网络（CNN）中，_________层的作用是减少特征图尺寸并保留主要特征，常用的操作有最大池化和平均池化。

6.对抗样本攻击是指通过_________扰动输入数据，使模型做出错误预测的攻击方式。

7.强化学习的三要素是_________、_________和奖励函数。

8.在模型部署时，为降低计算资源消耗，常用的优化技术包括_________（如将32位浮点数转为16位）和_________（如剪枝冗余参数）。

9.处理类别不平衡数据时，除了数据层面的过采样（如SMOTE）和欠采样，模型层面的常用方法是_________（如调整交叉熵损失的类别权重）。

三、简答题（每题8分，共32分）

1.简述数据清洗的主要步骤及每一步的具体操作。

2.对比监督学习与无监督学习的核心区别，并各举一个典型应用场景。

3.说明训练神经网络时“早停法（EarlyStopping）”的实施策略及其原理。

4.什么是模型的“泛化能力”？如何通过验证集和测试集评估泛化能力？

四、应用题（每题10分，共20分）

1.某团队需训练一个识别“交通信号灯颜色（红/黄/绿）”的图像分类模型，提供的训练数据存在以下问题：

红灯样本占比70%，黄灯占比5%，绿灯占比25%；

部分图像因拍摄角度问题，信号灯区域仅占画面的10%；

所有图像均为晴天白天拍摄，无雨天、夜间场景。

请设计针对性的数据预处理和增强方案，以提升模型性能。

2.某公司的文本分类模型（输入为用户评论，输出为“好评/中评/差评”）在上线后出现以下问题：训练集准确率92

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

人工智能训练师考试题及答案.docxVIP