大规模生成预训练模型高效量化方法GPTQ.pdfVIP

  • 0
  • 0
  • 约7.48万字
  • 约 16页
  • 2026-05-26 发布于北京
  • 举报

大规模生成预训练模型高效量化方法GPTQ.pdf

PublishedasaconferencepaperatICLR2023

GPTQ:ACCURATEPOST-TRAININGQUANTIZATION

FORGENERATIVEPRE-TRAINEDTRANSFORMERS

EliasFrantarSalehAshkboosTorstenHoeflerDanAlistarh

ISTAustriaETHZurichETHZurichISTAustriaNeuralMagic

ABSTRACT

3GenerativePre-trainedTransformermodels,knownasGPTor

文档评论(0)

1亿VIP精品文档

相关文档