2026年人工智能训练师考试试题及答案.docxVIP

  • 0
  • 0
  • 约4.92千字
  • 约 19页
  • 2026-03-17 发布于四川
  • 举报

2026年人工智能训练师考试试题及答案.docx

2026年人工智能训练师考试试题及答案

一、单项选择题(每题2分,共30分)

1.在训练一个用于医疗影像分割的U-Net模型时,下列哪种数据增强策略最可能提升模型对微小病灶的敏感度?

A.随机水平翻转

B.随机亮度扰动

C.随机弹性形变

D.随机高斯模糊

答案:C

解析:弹性形变可模拟组织形变,增强模型对几何变化的鲁棒性,对微小病灶尤其有效。

2.当使用Adam优化器时,若发现训练损失在初期剧烈震荡,最合理的调整是:

A.降低学习率并增大β?

B.降低学习率并减小β?

C.增大学习率并增大β?

D.增大学习率并减小ε

答案:B

解析:减小β?可降低动量惯性,降低学习率可抑制震荡。

3.在联邦学习场景下,客户端上传梯度而非原始数据,主要解决:

A.通信开销

B.数据隐私

C.模型异构

D.标签噪声

答案:B

解析:梯度上传避免原始数据泄露,符合隐私保护需求。

4.对于类别极度不平衡的文本分类任务,下列评价指标最不适合作为早停依据的是:

A.F1-macro

B.AUC-ROC

C.准确率

D.平均精度(AP)

答案:C

解析:准确率在极不平衡时易被多数类主导,失去敏感性。

5.在Transformer中,若将注意力头数从8减至1,模型参数量约减少:

A.12.5%

B.25%

C.50%

D.几乎不变

答案:A

解析:多头注意力参数量≈4d2,单头≈d2/2,减少约1/8。

6.使用混合精度训练时,LossScale过大可能导致:

A.梯度爆炸

B.梯度下溢

C.权重消失

D.激活饱和

答案:B

解析:LossScale过大使梯度超出FP16表示范围,出现下溢。

7.在强化学习中,若Q值被高估,最可能的原因是:

A.探索不足

B.奖励稀疏

C.最大化偏差

D.学习率过小

答案:C

解析:Bellman更新中的max操作导致系统性正向偏差。

8.对BERT进行领域自适应预训练时,以下策略最有效:

A.冻结全部参数,仅训练分类层

B.逐层解冻并微调

C.仅训练位置嵌入

D.仅训练LayerNorm参数

答案:B

解析:逐层解冻可平衡泛化与specialization,防止灾难性遗忘。

9.在目标检测中,若将IoU阈值从0.5提高到0.75,mAP通常:

A.上升

B.下降

C.不变

D.先升后降

答案:B

解析:更高阈值使正样本减少,召回率下降,mAP降低。

10.使用知识蒸馏时,温度参数T→∞,软标签分布趋近:

A.均匀分布

B.one-hot

C.高斯分布

D.伯努利分布

答案:A

解析:T越大,softmax输出越平滑,趋近均匀。

11.在图神经网络中,GCN与GAT的主要差异在于:

A.是否使用非线性激活

B.是否引入注意力权重

C.是否支持异构图

D.是否支持归纳式学习

答案:B

解析:GAT通过可学习权重替代固定归一化系数。

12.当使用EarlyStopping时,若验证集损失连续10轮未下降,耐心系数为5,则:

A.立即停止

B.继续5轮后停止

C.继续10轮后停止

D.永不停止

答案:B

解析:耐心=5表示允许再观察5轮。

13.在自监督学习中,对比损失InfoNCE的负样本数量增加,会:

A.降低梯度方差

B.提高计算复杂度

C.两者皆是

D.两者皆非

答案:C

解析:更多负样本使估计更准确,但计算量增大。

14.对LSTM采用权重丢弃(dropout)时,最佳实践是:

A.仅在输入门应用

B.仅在隐藏状态应用

C.同时在输入与隐藏应用,并保持同一mask

D.不应用

答案:C

解析:同一时间步共享mask可防止梯度错位。

15.在模型压缩中,通道剪枝后需进行:

A.知识蒸馏

B.权重重绕

C.微调

D.量化

答案:C

解析:剪枝破坏权重平衡,需微调恢复精度。

二、多项选择题(每题3分,共15分)

16.以下哪些操作可有效缓解GAN训练中的模式崩塌?

A.使用Wasserstein损失

B.添加噪声到判别器输入

C.采用历史平均生成器

D.增大批大小

答案:A、B、C

解析:W距离平滑梯度;输入噪声增加鲁棒性;历史平均稳定生成器。

17.在NLP任务中,子词算法BPE可能引发的问题包括:

A.词汇表爆炸

B.编码歧义

C.跨语言不一致

D.梯度消失

答案:A、B、C

解析:BPE可能产生多义片段,跨语言共享差,词汇表过大。

18.下列关于模型可解释性方法IntegratedGradients的描述正确的是:

A.需基线输入

B.满足敏感性公理

C.对ReLU网络等价于梯度×输入

D.可生成像素级重要性

答案:A、B、D

解析:IG需基线,满足敏感性,输出像素重要

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档