自然语言处理:大模型理论与实践 课件 第九章 大模型微调.pptx

自然语言处理:大模型理论与实践 课件 第九章 大模型微调.pptx

第九章大模型微调

本章内容9.2指令微调9.2.1指令微调概念9.2.2构造指令实例9.2.3指令微调任务9.2.4多模态指令微调9.2.5指令微调优化方法9.2.6指令微调的效果9.4微调算法9.3对齐微调9.3.2RLHF算法9.3.3RLHF的发展历程9.3.4对齐微调技术9.3.5偏好数据集

9.2.1指令微调概念大模型预训练任务(基础课学习)大模型微调任务(专业课实践)接收指令理解指令形成策略实施行动反馈调整经验积累面对未知的任务,人们通常遵循如下的系统化流程:在大语言模型领域,指令微调涉及对预训练模型进行再训练,以适应如文本分类、对话生成等特定任

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档