基于向量随机矩阵自适应:VeRA.pdfVIP

  • 0
  • 0
  • 约12.06万字
  • 约 34页
  • 2026-05-11 发布于北京
  • 举报

VERA:基于向量的随机矩阵自适应

DawidJ.Kopiczko∗†TijmenBlankevoort高YukiM.AsanoQUVA实

QUVA阿姆斯通AI研究1验室阿姆斯特丹大学

特丹大学

3低秩自适应(LoRA)是一种流行的方法,用于在微调大型语言模型时减少可

2

0训练参数的数量,但在扩展到更大模型或部署多个用户特定或任务特定的自适

2应模型时仍严重的。在这项工作中,我们提出了Vector‑based

tRandomMatrixAdaptation(VeRA),与LoRA相比,它将可训练参数数

c

O量减少了10倍,同时保持了相同的性能。通过在所有层对低秩矩阵并

7学的缩放向量来实现这一点。我们在GLUE和E2E基准上展示了其有效性,

1

文档评论(0)

1亿VIP精品文档

相关文档