实战Transformers模型量化:AWQ——面向激活权重量化.pdf

实战Transformers模型量化:AWQ——面向激活权重量化.pdf

AWQ:面向激活的权重量化用于大语言模型的压

缩和加速

1∗111311

123

吉林,2∗党行宇淦创麻省理工学院交通大学大

3

2

0

文档评论(0)

1亿VIP精品文档

相关文档