电子行业存储:AI推理带来需求爆发、驱动范式升级,周期能见度大幅拉长.pptxVIP

  • 0
  • 0
  • 约 0页
  • 2026-06-23 发布于北京
  • 举报

电子行业存储:AI推理带来需求爆发、驱动范式升级,周期能见度大幅拉长.pptx

电子行业存储:AI推理带来需求爆发、驱动范式升级,周期能见度大幅拉长

存储:

AI推理带来需求爆发、驱动范式升级,

周期能见度大幅拉长

1

n存储是AI推理的核心瓶颈,驱动存储需求爆发、存储范式改进。

LLM推理的解码阶段本质是memory-bound,核心存储负载包括:模型权重、KVCache、激活值、RAG向量库等。相较于模型权重等静态张量数据,KVCache是随上下文长度和并发数动态膨胀的张量数据,推理性能(TTFT/TPS)高度依赖对KVCache的保存和对KVCache的管理效率。在传统冯·诺依曼架构下,大模型推理时的大量高维张量数据、Transfomer的自注意力机制均加剧了内存墙问题,数据量巨大、搬运成本高,严重拖慢推理效率,存储使访存带宽与延迟逐步成为制约系统吞吐与响应性能的核心瓶颈,因此黄仁勋一直在说:“GPU大部分时间都在等数据,而不是在计算”,“计算能力增长远快于内存带宽,GPU经常处于饥饿状态(starvingfordata)。”而提升存储带宽和容量可以显著增强推理性能、降低推理成本,“以存代算”是必然趋势。

随着模型越来越大、上下文越来越长、使用人数增加等,AI推理带来HBM、DRAM、SSD、HDD的需求全面爆发,同时面对大模型推理的访存受限问题,产业界也在推进存储器性能升级和存储层级优化,存储从单一层级向高带宽+大容量+分级管理的协同架构演进,存储与

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档