大语言模型参数规模与智能涌现关系探讨.pdf

大语言模型参数规模与智能涌现关系探讨.pdf

043|心智3:GPT的智能有多强?

欢迎回到《科技参考》,我是

昨天我们看到了GPT-2大语言模型中单个神经元到底学会了什么,也

确认了大语言模型确实学会了一些训练素材里肯定没有的技能,比如数

学计算的能力。但参数规模足够大,就一定会涌现出一些之前没有的能

力吗?

是:会的。

我们来看DeepMind和斯坦福大学的这篇研究:大语言模型涌现的能

力(EmergentAbilitiesofLargeLanguageModels)。

上面这8张图表,横坐标是训练时的计算量,用浮点数的运算次数来表

示。其实并不是因为训练量加大,性能才增加,而是

文档评论(0)

1亿VIP精品文档

相关文档