- 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
- 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2025年大模型推理缓存机制设计习题(含答案与解析)
一、选择题(每题3分,共30分)
1.大模型推理缓存机制中,以下哪种缓存粒度在2025年的多模态大模型场景中最可能同时兼顾命中率与存储效率?
A.全模型输出级(完整生成结果)
B.层输出级(中间隐藏层特征)
C.Token级(单个生成token)
D.对话轮次级(单轮对话输入输出对)
答案:B
解析:多模态大模型(如支持文本-图像-视频的统一模型)推理时,中间层特征(如Transformer的隐藏层输出)往往在不同输入中存在重复计算(例如相似语义的文本或视觉特征)。层输出级缓存既能复用部分计算(相比全
您可能关注的文档
最近下载
- 0102、U9 cloud供应链-采购管理.pptx VIP
- 上海市各机构名称英译.docx VIP
- 0303、U9 cloud财务-应收管理.pptx VIP
- 0302、U9 cloud财务-应付管理.pptx VIP
- 0304、U9 cloud财务-总账管理.pptx VIP
- 数据通信与计算机网络(第3版)全套PPT课件.pptx
- 0105、U9 cloud供应链-多组织供应链协同.pptx VIP
- 第5课 走近科学家 第3课时(课件)2025-2026学年道德与法治三年级上册统编版.pptx VIP
- 临床药物治疗学第四节.pdf VIP
- 2025年湖南中医药高等专科学校单招职业技能测试必刷测试卷最新.docx VIP
文档评论(0)