2026年人工智能训练师数据分析报告实操题库.docxVIP

  • 1
  • 0
  • 约8.74千字
  • 约 23页
  • 2026-04-10 发布于四川
  • 举报

2026年人工智能训练师数据分析报告实操题库.docx

2026年人工智能训练师数据分析报告实操题库

一、单项选择题(每题2分,共20分)

1.在训练图像分类模型时,发现验证集准确率持续上升而训练集准确率震荡下降,最可能的原因是

A.学习率过大

B.批次大小过小

C.标签噪声过高

D.数据增强过度

答案:D

解析:训练集准确率下降而验证集上升,说明模型在“遗忘”训练样本,典型表现为增强强度过高导致训练分布漂移。

2.对文本进行子词切分时,若词表出现“##ing”,则该标记在BPE算法中的合并优先级取决于

A.相邻字符对在所有子词中的共现频率

B.该子词在验证集上的困惑度降幅

C.该子词在词表中的Unicode码点序

D.该子词长度与超参数α的乘积

答案:A

解析:BPE每次合并频率最高的相邻字符对,“##ing”作为后缀子词,其优先级由共现频率决定。

3.在联邦学习场景下,为防御模型中毒攻击,服务器端聚合梯度时最轻量的防御策略是

A.Krum

B.Trimmed-mean

C.局部差分隐私加噪

D.基于余弦相似度的异常检测

答案:B

解析:Trimmed-mean无需额外模型副本,计算复杂度O(nlogn),在边缘设备场景下最轻量。

4.当使用Transformer训练代码生成模型时,若发现attention权重在深层出现“对角线消失”现象,可优先调整的超参数是

A.attentiondropout

B.

文档评论(0)

1亿VIP精品文档

相关文档