最新2026年人工智能训练师最新试题及答案.docxVIP

  • 0
  • 0
  • 约6.96千字
  • 约 17页
  • 2026-03-30 发布于四川
  • 举报

最新2026年人工智能训练师最新试题及答案.docx

最新2026年人工智能训练师最新试题及答案

一、单项选择题(每题1分,共20分)

1.在联邦学习框架下,客户端上传的参数通常采用以下哪种方式保护隐私?

A.明文梯度?B.同态加密?C.差分隐私噪声?D.模型蒸馏

答案:C

解析:联邦学习通过差分隐私在梯度中添加噪声,防止从梯度反推出原始数据。

2.当使用Transformer训练中文生成模型时,若出现“重复生成同一句话”现象,最优先排查的超参数是:

A.learning_rate?B.warmup_steps?C.repetition_penalty?D.max_position_embeddings

答案:C

解析:repetition_penalty直接抑制已生成token的再次选中,缓解重复问题。

3.在强化学习人类反馈(RLHF)阶段,奖励模型(RM)的损失函数通常采用:

A.MSE?B.CrossEntropy?C.Bradley-Terry交叉熵?D.Huber

答案:C

解析:Bradley-Terry模型将人类偏好转化为pairwise排序损失,是RM主流做法。

4.若要对StableDiffusion进行“文本到图像”风格化微调,最节省显存的方法是:

A.全参数微调?B.LoRA?C.AdaLoRA?D.知识蒸馏

答案:B

解析:LoRA通过低秩分解仅训练少量旁路参数,显存占用10

文档评论(0)

1亿VIP精品文档

相关文档