数值表示与量化技术在模型优化中应用.pdfVIP

  • 1
  • 0
  • 约8.42千字
  • 约 27页
  • 2026-04-30 发布于北京
  • 举报

数值表示与量化技术在模型优化中应用.pdf

如何表⽰数值

⼀个给定的值通常表⽰为浮点数(在计算机科学中称为floats):⼀个带⼩数点的正数或负数。

这些值由“位”(bits)或⼆进制数字表⽰。IEEE-754描述了如何⽤位来表⽰⼀个值的三部分:符号位(sign)、指数

(exponent)和分数(fraction)(或称为尾数,mantissa)。

这三个⽅⾯可以共同⽤于根据⼀组给定的⽐特值计算出⼀个数值:

我们⽤来表⽰⼀个值的位数越多,它通常就越精确:

MemoryConstraints

我们可⽤的位数越多,可以表⽰的数值范围就越⼤。

⼀个给定的表⽰法可以取值的区间称为动态范围,⽽两个相邻值之间的距离称为精度。

这些位有⼀个很⽅便的特性,就是我们可以计算出你的设备需要多少内存来⼀个给定的值。由于内存中1个字节

(byte)有8个位(bit),我们可以为⼤多数形式的浮点表⽰创建⼀个基本。

现在,我们假设有⼀个700亿参数的模型。⼤多数模型原⽣都⽤32位浮点数(通常称为全精度)表⽰,这意味着仅仅

加载这个模型就需要280GB的内存。

因此,最⼩化⽤于表⽰模型参数的位数(以及在训练期间!)变得⾮常有吸引⼒。然⽽,随着数值精度的降低,模型

的准确率通常也会下降。我们希望在保持准确率的同时,减少表⽰数值的位数……这就是量

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档