20|模型微调:创建一个属于自己的大模型.pdfVIP

  • 4
  • 0
  • 约8.4千字
  • 约 12页
  • 2026-06-19 发布于山东
  • 举报

20|模型微调:创建一个属于自己的大模型.pdf

20|模型微调:创建一个属于自己的大模型

郑晔·程序员的AI开发第一课

你好,我是郑晔!

前面两讲,我们讲了如何使用别人创建好的开源模型,这可以帮助我们控制成本,或是规避风

险。这些大模型都需要与我们前面讲的技术配合起来,才能够实现特定的应用功能。除了使用

别人的模型,我们也可以使用自己的模型。

前面讲RAG时,我们说过,它本质上是让大模型知道更多的东西,尤其是属于你自己业务领

域的东西。当时我们就说,RAG只是其中的一种选择,还有另外一种选择,就是模型微调。

这一讲,我们就来说说模型微调。

什么是模型微调

模型微调,顾名思义,就是对模型微微做一些调整。为什么要做微调呢?如果可以的话,每个

公司都想拥有一个属于自己的大模型。但是,现实比较残酷,训练一个大模型需要花太多的

钱。按照一些大公司的说法,一个千亿参数的大模型,训练一次的成本大约需要几百万美元。

这显然就超过一个普通公司承受的范围。虽然我们无法训练一个属于自己的大模型,但一个好

消息是,我们可以做模型微调。

大模型是构建于神经网络基础之上的,神经网络可以理解成一个一个的神经元构建的网络。训

练模型,就是在调整神经元之间的连接方式。一次完整的训练就相当于把所有的神经元连接都

调整一遍,这个计算规模相当之大,是我们无法承受的。

所谓微调,就是把一个训练好的模型中的一部分连接重新调

文档评论(0)

1亿VIP精品文档

相关文档