2025年高级人工智能训练师核心备考试题库及答案.docxVIP

  • 0
  • 0
  • 约3.3千字
  • 约 7页
  • 2026-06-20 发布于四川
  • 举报

2025年高级人工智能训练师核心备考试题库及答案.docx

2025年高级人工智能训练师核心备考试题库及答案

某高级AI训练师需要为多模态大语言模型训练生成高质量的图文配对数据,针对存在主体错位的图文样本(即文本描述的核心对象与图像实际主体不一致),以下哪种处理方案最优?

A.直接过滤删除该样本B.仅保留文本部分用于纯文本训练C.使用图像识别模型识别图像实际主体后,改写文本匹配主体D.手动修改文本后重新入库

答案:C。解析:高级AI训练师需要在数据质量和数据利用率之间做平衡,直接删除会浪费有效数据,仅保留文本浪费了图像维度的信息,手动修改效率极低不适用于大规模数据集处理,使用预训练图像识别模型自动修正文本匹配主体,既保证了数据质量,又最大化利用了已有数据,同时适配大规模数据处理的效率要求,是最优方案。

在基于人类反馈的强化学习对齐(RLHF)中,针对大模型生成内容的排序阶段,当多个标注员对同一生成内容的排序结果一致性低于阈值时,以下哪种处理方式最符合高级AI训练师的对齐规范?

A.随机选取一组排序结果作为标签B.剔除该生成内容对,不进入训练C.组织标注员重新对齐标注规则,完成二次标注后重新验证一致性,达标后入库D.直接取多数票结果作为最终标签

答案:C。解析:排序一致性低说明标注规则存在模糊边界,或是标注员对对齐目标的理解出现偏差,随机选取、多数票都会引入噪声标签,直接剔除会减少有效训练数据,降低对齐效果,重新对

文档评论(0)

1亿VIP精品文档

相关文档