大语言模型通识 第6章 大模型的开发组织.pptVIP

  • 7
  • 0
  • 约1.41万字
  • 约 80页
  • 2024-08-22 发布于江苏
  • 举报

大语言模型通识 第6章 大模型的开发组织.ppt

【测试集】评估性能。测试集用于评估模型的最终性能,是考验模型的最后一关。它不参与模型的学习参数过程,也不介入超参数的选择,它的存在就是为了对模型的最终性能(即泛化能力)做出公正的评价。一个人工智能模型只有通过了测试集的考验,才能真正称得上是具备良好泛化能力的模型。6.3.1目的与功能不同训练集、测试集、验证集这三者和模型的数据交互频率不同。训练集会不断交互,验证集是定期交互,而测试集只交互一次。【训练集】不断交互。使用训练集时,模型在训练阶段不断与训练集交互,通过多次地学习、调整和迭代来提高性能。它是在训练集的多次反馈中完成优化的。在训练集中,模型通过一次次的迭代优化,逐步提升自己的工艺水平。6.3.2数据交互频率不同【验证集】定期交互。验证集在训练过程中的不同时间点交互,帮助开发人员调整模型参数和决定训练的结束点。它在训练过程中的每一个关键时刻出现,为开发人员提供宝贵的反馈和指引,帮助开发人员调整模型的超参数。所以,和训练集中的情况不一样,模型不会在验证集中反复训练,只会定期和验证集进行数据交互。验证集的每一次反馈,都是对模型的一次重要检验,所获得的数据评估指标,也是优化人工智能性能的重要依据。6.3.2数据交互频率不同【测试集】交互一次。测试集在整个训练过程完成后交互,仅一次,用于模型的最终评估,这个活动只有在整个训练过程圆满完成后才会出现。测试集是模

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档