大语言模型通识第6章大模型的开发组织.pptVIP

下载本文档

7
0
约1.41万字
约 80页
2024-08-22 发布于江苏
举报

大语言模型通识第6章大模型的开发组织.ppt

【测试集】评估性能。测试集用于评估模型的最终性能，是考验模型的最后一关。它不参与模型的学习参数过程，也不介入超参数的选择，它的存在就是为了对模型的最终性能（即泛化能力）做出公正的评价。一个人工智能模型只有通过了测试集的考验，才能真正称得上是具备良好泛化能力的模型。6.3.1目的与功能不同训练集、测试集、验证集这三者和模型的数据交互频率不同。训练集会不断交互，验证集是定期交互，而测试集只交互一次。【训练集】不断交互。使用训练集时，模型在训练阶段不断与训练集交互，通过多次地学习、调整和迭代来提高性能。它是在训练集的多次反馈中完成优化的。在训练集中，模型通过一次次的迭代优化，逐步提升自己的工艺水平。6.3.2数据交互频率不同【验证集】定期交互。验证集在训练过程中的不同时间点交互，帮助开发人员调整模型参数和决定训练的结束点。它在训练过程中的每一个关键时刻出现，为开发人员提供宝贵的反馈和指引，帮助开发人员调整模型的超参数。所以，和训练集中的情况不一样，模型不会在验证集中反复训练，只会定期和验证集进行数据交互。验证集的每一次反馈，都是对模型的一次重要检验，所获得的数据评估指标，也是优化人工智能性能的重要依据。6.3.2数据交互频率不同【测试集】交互一次。测试集在整个训练过程完成后交互，仅一次，用于模型的最终评估，这个活动只有在整个训练过程圆满完成后才会出现。测试集是模

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

大语言模型通识第6章大模型的开发组织.pptVIP