- 2
- 0
- 约2.84万字
- 约 42页
- 2026-06-06 发布于江西
- 举报
芯片开发与应用手册
第1章芯片架构演进与核心特性
1.1传统冯·诺依曼架构的瓶颈与突破
传统冯·诺依曼架构以线性存储总线为核心,数据在CPU与内存之间频繁读写,导致训练中的大规模矩阵运算因数据搬运瓶颈而算力受限。突破方案引入片上高速缓存(SRAM)作为局部工作区,将高频计算所需的特征图(FeatureMap)与权重参数(Weights)局部化,显著减少内存访问延迟。
经验数据显示,在1024维特征图场景下,SRAM的局部缓存可使推理吞吐量提升30%-50%,有效缓解“内存墙”效应。随着模型参数量从千亿级向万亿级增长,传统架构的串行读取模式已无法满足长序列注
原创力文档

文档评论(0)