训练用于数据处理的大语言模型.pptx

训练用于数据处理的大语言模型;提示工程:(学生不参加模拟考试,而是为新考试做笔记)——参数无变化

(硬)提示词调优:人工设计的自然语言,人类可理解的提示词;对提示词的选择敏感

(软)提示词调优

LM-BFF:提示词调优+演示+模板生成

P调优:微调输入(提示词)嵌入

通过软提示词提高性能

模型微调(学生参加多次模拟考试,变得更加熟练,并且参加新考试)——参数变化

前缀调优:仅优化前缀嵌入

缩短训练时间,提高空间效率,适用于所有模型,但需要大量训练样本

微调整体模型——成本高昂,但能产生最佳效果。

指令调优:人工引导的强化学习;(软)提示词调优

前缀调优;性能和实施成本之间的权衡;参数高效微调

文档评论(0)

1亿VIP精品文档

相关文档