能效无线大语言模型推理通过不确定性和重要性感知推测解码.pdf

能效无线大语言模型推理通过不确定性和重要性感知推测解码.pdf

能效无线大语言模型推理通过

不确定性和重要性感知推测解码

JihoonPark,SeungeunOh,andSeong-LyunKim

摘要—为了应对资源受限环境下对设备端大语言模型推理

日益增长的需求,混合语言模型(HLM)应运而生,结合了轻量

级本地模型与强大的基于云端的大语言模型。最近关于HLM

的研究主要集中在提高准确性和延迟上,但往往忽视了通信和

能效。我们提出

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档