- 9
- 0
- 约3.86千字
- 约 6页
- 2026-06-10 发布于上海
- 举报
AI硬件散热技术:从风冷到浸没式液冷的工程实践
AI算力的爆发,带来了功耗的爆发,GPU的功耗,从原来的100W,飙升到了700W、900W,甚至下一代的Rubin,会突破2500W,单机柜的功耗,从原来的20kW,跃升到了120kW、200kW。传统的风冷散热,已经彻底的无法满足需求,散热,成为了AI算力的最大瓶颈。在这一背景下,散热技术,正在经历一场彻底的革命,从传统的风冷,走向冷板液冷,再走向浸没式液冷,一步步的突破散热的极限,支撑起万亿参数大模型的算力需求。
一、风冷的极限:为什么风冷走到了尽头
风冷,是我们最熟悉的散热技术,它用风扇,把冷空气吹到芯片的表面,把热量带走,这套技术,已经用了几十年,但是,现在,它已经走到了物理的极限。
首先,热通量的瓶颈。风冷的换热系数,有一个上限,空气的导热能力,太差了,当芯片的热通量,超过50W/cm2,风冷,就无法把热量带走了,芯片的温度,会急剧的升高,触发降频,保护硬件。而现在的H100、B200,热通量,已经超过了100W/cm2,风冷,根本压不住。
然后,功率密度的瓶颈。风冷的单机柜,最大的散热能力,只有40kW,超过这个,热量就散不出去了,而现在的AI机柜,功耗,已经到了120kW,是风冷极限的3倍,这就意味着,你要把一个机柜的设备,拆成3个机柜,空间的浪费,非常的大,而且,成本,也高了很多。
还有,能耗的失控。风冷的PUE,也
您可能关注的文档
- 19_AI硬件安全物理攻击防护与可信执行环境的硬件实现.docx
- 20_AI硬件未来趋势神经形态计算与类脑芯片的技术探索.docx
- 16_AI硬件测试与验证从芯片到整机的可靠性测试.docx
- 17_AI硬件供应链从晶圆制造到封装测试的产业链.docx
- 18_低功耗AI硬件可穿戴设备的微型AI芯片技术.docx
- 13_国产化AI芯片从昇腾到寒武纪的技术路线.docx
- 14_AI硬件功耗优化从芯片级到系统级的能效比提升.docx
- 15_大模型训练硬件适配并行计算与集群互联的核心技术.docx
- 10_端侧AI硬件AI_PC与手机NPU的技术演进.docx
- 11_边缘AI硬件低功耗边缘计算盒子的硬件设计.docx
原创力文档

文档评论(0)