12_AI硬件散热技术从风冷到浸没式液冷的工程实践.docxVIP

  • 9
  • 0
  • 约3.86千字
  • 约 6页
  • 2026-06-10 发布于上海
  • 举报

12_AI硬件散热技术从风冷到浸没式液冷的工程实践.docx

AI硬件散热技术:从风冷到浸没式液冷的工程实践

AI算力的爆发,带来了功耗的爆发,GPU的功耗,从原来的100W,飙升到了700W、900W,甚至下一代的Rubin,会突破2500W,单机柜的功耗,从原来的20kW,跃升到了120kW、200kW。传统的风冷散热,已经彻底的无法满足需求,散热,成为了AI算力的最大瓶颈。在这一背景下,散热技术,正在经历一场彻底的革命,从传统的风冷,走向冷板液冷,再走向浸没式液冷,一步步的突破散热的极限,支撑起万亿参数大模型的算力需求。

一、风冷的极限:为什么风冷走到了尽头

风冷,是我们最熟悉的散热技术,它用风扇,把冷空气吹到芯片的表面,把热量带走,这套技术,已经用了几十年,但是,现在,它已经走到了物理的极限。

首先,热通量的瓶颈。风冷的换热系数,有一个上限,空气的导热能力,太差了,当芯片的热通量,超过50W/cm2,风冷,就无法把热量带走了,芯片的温度,会急剧的升高,触发降频,保护硬件。而现在的H100、B200,热通量,已经超过了100W/cm2,风冷,根本压不住。

然后,功率密度的瓶颈。风冷的单机柜,最大的散热能力,只有40kW,超过这个,热量就散不出去了,而现在的AI机柜,功耗,已经到了120kW,是风冷极限的3倍,这就意味着,你要把一个机柜的设备,拆成3个机柜,空间的浪费,非常的大,而且,成本,也高了很多。

还有,能耗的失控。风冷的PUE,也

文档评论(0)

1亿VIP精品文档

相关文档