刚刚,黄仁勋一口气解密6颗芯片,召唤出最强AI超算.docxVIP

  • 0
  • 0
  • 约3.28千字
  • 约 6页
  • 2026-02-05 发布于江苏
  • 举报

刚刚,黄仁勋一口气解密6颗芯片,召唤出最强AI超算.docx

刚刚,黄仁勋一口气解密6颗芯片,召唤出最强AI超算

一、CES2026焦点:黄仁勋携6款芯片解码推理型AI“落地密码”

2026年1月6日,拉斯维加斯CES主舞台上,英伟达CEO黄仁勋身着标志性黑色皮衣的身影再次成为全球科技界的焦点——继2025年提出“物理AI时代”愿景后,他在本年度“科技春晚”上抛出了更具冲击力的“答卷”:一口气解密6款围绕推理型AI(Reasoning/AgenticAI)设计的芯片及配套技术,系统性解决AI“多想一会就贵、规模化就卡、持续工作就断”的三大瓶颈,为自动驾驶、机器人等物理AI场景的规模化落地铺设“算力底座”。

“2025年我们讲‘物理AI的未来’,2026年我们要解决‘如何让未来发生’。”黄仁勋在演讲中直言,过去一年AI行业的变革远超预期:以DeepSeekR1为代表的开源推理模型下载量爆发式增长,虽比前沿模型慢半年,但每六个月就追近一步——这意味着“推理型AI的普及已经不是‘要不要’,而是‘能不能撑住’”。而此次发布的6款芯片,正是针对推理型AI长期运行的核心痛点:算力架构不匹配、网络互联效率低、上下文难以持续、存储成本高。

算力层:Rubin平台重构“长期推理”底层逻辑

作为此次发布的“核心算力引擎”,Rubin平台被定义为“为推理型AI而生的算力架构”。与2025年的Blackwell芯片侧重训练不同,Rubin平台针对“AI需要持续思考、长期工作”的需求,重新设计了计算单元、内存层级与功耗管理——其目标只有一个:让AI“多想一会(更长上下文)、算得起(更低成本)、跑得久(稳定规模化)”。黄仁勋透露,Rubin平台的单卡推理效率较上一代提升40%,而集群部署后的规模化推理成本降低35%,直接瞄准“智能体24小时工作”的场景需求。

网络层:NVLink6+Spectrum-X打通“数据流动高速路”

推理型AI的另一个瓶颈是“多芯片协同效率”——当AI需要处理百万级token的长上下文时,芯片间的数据传输速度直接决定“思考速度”。此次发布的NVLink6互联技术,将单链路带宽提升至1.6TB/s,较上一代翻番;而搭配Spectrum-X以太网交换机后,整个集群的网络延迟降低50%,吞吐量提升3倍。“以前100个GPU协同推理需要1秒传输数据,现在只要0.3秒。”黄仁勋用通俗的语言解释,“这相当于给AI的‘大脑’装了更粗的‘神经纤维’。”

存储层:推理上下文内存存储平台解决“记忆断层”

“AI为什么不能像人一样‘记住之前的对话’?因为上下文存储成本太高。”黄仁勋直指推理型AI的“记忆痛点”:传统存储架构无法高效保存AI的“思考过程”,每一次上下文切换都要重新加载数据,成本陡增。此次推出的“推理上下文内存存储平台”,通过“分层缓存+实时压缩”技术,将长上下文存储成本降低60%,同时实现“上下文持续保留7天以上”——这意味着,AI智能体可以记住用户一周前的对话细节,无需每次“重新认识”。

模型层:Alpamayo推动“生成式”向“推理式”跃迁

在模型工具层面,英伟达推出Alpamayo、Nemotron、CosmosReason三大推理型模型工具链。其中,Alpamayo被称为“智能体的‘操作系统’”,支持AI从“一次性响应”转向“长期工作”——比如自动驾驶中的AI需要持续观察路况、规划路线、调整策略,Alpamayo能让这些任务在一个模型框架内完成,无需切换多个模块;而CosmosReason则聚焦“物理世界推理”,可将传感器数据(如激光雷达、摄像头)与数字孪生模型结合,让AI理解“真实世界的物理规则”(比如“推一把椅子会移动”)。

数据处理层:BlueField-4支撑“千亿级”基础设施

针对推理型AI的“底层数据处理”,英伟达发布BlueField-4数据处理单元(DPU)。这款芯片支持800Gb/s的网络吞吐量,是上一代的2倍,同时内置AI推理加速单元——这意味着,BlueField-4不仅能“传输数据”,还能“提前处理数据”(比如过滤无用的传感器信息),将前端数据处理效率提升50%,直接减轻后端GPU的负担。黄仁勋强调:“当你有1000台机器人同时运行,BlueField-4能帮你把数据‘挤干水分’,让GPU只算该算的。”

二、从“愿景”到“量产”:最强AI超算GB200NVL72的“性能革命”

在6款芯片的基础上,黄仁勋亮出了此次发布的“终极杀器”——GB200NVL72AI超级计算机。这款被称为“最强推理超算”的系统,由72个GPU通过NVLink6连接而成,其性能较上一代提升10倍,而运行成本降低10倍——这组“10倍”数据,直接刷新了推理型AI超算的“性价比天花板”。

“去年我们展示了Blackwell的训练能力,今年我们要让推理也能‘用得起’。”黄仁勋现场

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档