- 2
- 0
- 约3.85千字
- 约 6页
- 2026-06-10 发布于上海
- 举报
存算一体AI芯片:突破冯诺依曼瓶颈的架构与工艺实现
在传统的计算机架构中,冯诺依曼瓶颈已经困扰了行业数十年。计算单元和存储单元的分离,导致数据需要在两者之间频繁搬运,而搬运数据的能耗,是计算本身能耗的上百倍。随着AI模型的规模越来越大,这一矛盾变得越来越突出:英伟达的CEO黄仁勋曾坦言,“GPU有70%的时间在等待数据”。在这一背景下,存算一体(Computing-in-Memory,CIM)技术,作为一种革命性的架构创新,成为了突破冯诺依曼瓶颈的终极方案,它将计算和存储融合在一起,让数据在存储的位置就完成计算,彻底消除了数据搬运的开销。
一、冯诺依曼瓶颈:AI算力的终极障碍
要理解存算一体的价值,首先要明白冯诺依曼瓶颈的本质。传统的冯诺依曼架构,把计算和存储分开,CPU/GPU是计算单元,内存/显存是存储单元。当CPU要计算的时候,需要先把数据从存储单元读到缓存,再读到寄存器,计算完成后,再把结果写回存储单元。这个过程中,数据的搬运,消耗了绝大多数的能量和时间。
根据研究,在传统的芯片中,一次32位浮点运算的能耗,大约是1pJ,而把这32位数据从DRAM内存读到CPU,能耗大约是64pJ,是计算本身的64倍。如果是从片外的存储读取,这个差距会更大。这就是为什么,AI大模型的训练,90%的能耗都花在了数据搬运上,而不是计算本身。
随着AI模型的规模从数十亿参数增长到万亿参数,这一矛
您可能关注的文档
- 19_AI硬件安全物理攻击防护与可信执行环境的硬件实现.docx
- 20_AI硬件未来趋势神经形态计算与类脑芯片的技术探索.docx
- 16_AI硬件测试与验证从芯片到整机的可靠性测试.docx
- 17_AI硬件供应链从晶圆制造到封装测试的产业链.docx
- 18_低功耗AI硬件可穿戴设备的微型AI芯片技术.docx
- 13_国产化AI芯片从昇腾到寒武纪的技术路线.docx
- 14_AI硬件功耗优化从芯片级到系统级的能效比提升.docx
- 15_大模型训练硬件适配并行计算与集群互联的核心技术.docx
- 12_AI硬件散热技术从风冷到浸没式液冷的工程实践.docx
- 10_端侧AI硬件AI_PC与手机NPU的技术演进.docx
最近下载
- 亲水性纤维及纺织品.ppt VIP
- 管理沟通(第6版)案例分析参考答案(全).docx VIP
- 80吨履带吊性能表 中联QUY80.pdf VIP
- 军官选调面试题及答案.doc VIP
- 2024年广东省中考英语试题(含听力音频和答案).docx VIP
- 2024~2025学年江苏省泰州市姜堰区统编版一年级下册期末考试语文试卷.doc VIP
- (医学书籍)中国糖尿病患者胰岛素使用管理规范最终版.pdf
- 期末模拟考试卷01--2024-2025学年上学期高一思想政治课《中国特色社会主义》(含答案).docx VIP
- 高频精选:军官选调面试题及答案.doc VIP
- 2026陕西有色招聘题库及答案.doc VIP
原创力文档

文档评论(0)