- 1
- 0
- 约8.42千字
- 约 27页
- 2026-04-30 发布于北京
- 举报
如何表⽰数值
⼀个给定的值通常表⽰为浮点数(在计算机科学中称为floats):⼀个带⼩数点的正数或负数。
这些值由“位”(bits)或⼆进制数字表⽰。IEEE-754描述了如何⽤位来表⽰⼀个值的三部分:符号位(sign)、指数
(exponent)和分数(fraction)(或称为尾数,mantissa)。
这三个⽅⾯可以共同⽤于根据⼀组给定的⽐特值计算出⼀个数值:
我们⽤来表⽰⼀个值的位数越多,它通常就越精确:
MemoryConstraints
我们可⽤的位数越多,可以表⽰的数值范围就越⼤。
⼀个给定的表⽰法可以取值的区间称为动态范围,⽽两个相邻值之间的距离称为精度。
这些位有⼀个很⽅便的特性,就是我们可以计算出你的设备需要多少内存来⼀个给定的值。由于内存中1个字节
(byte)有8个位(bit),我们可以为⼤多数形式的浮点表⽰创建⼀个基本。
现在,我们假设有⼀个700亿参数的模型。⼤多数模型原⽣都⽤32位浮点数(通常称为全精度)表⽰,这意味着仅仅
加载这个模型就需要280GB的内存。
因此,最⼩化⽤于表⽰模型参数的位数(以及在训练期间!)变得⾮常有吸引⼒。然⽽,随着数值精度的降低,模型
的准确率通常也会下降。我们希望在保持准确率的同时,减少表⽰数值的位数……这就是量
原创力文档

文档评论(0)