- 0
- 0
- 约3.28千字
- 约 6页
- 2026-02-05 发布于江苏
- 举报
刚刚,黄仁勋一口气解密6颗芯片,召唤出最强AI超算
一、CES2026焦点:黄仁勋携6款芯片解码推理型AI“落地密码”
2026年1月6日,拉斯维加斯CES主舞台上,英伟达CEO黄仁勋身着标志性黑色皮衣的身影再次成为全球科技界的焦点——继2025年提出“物理AI时代”愿景后,他在本年度“科技春晚”上抛出了更具冲击力的“答卷”:一口气解密6款围绕推理型AI(Reasoning/AgenticAI)设计的芯片及配套技术,系统性解决AI“多想一会就贵、规模化就卡、持续工作就断”的三大瓶颈,为自动驾驶、机器人等物理AI场景的规模化落地铺设“算力底座”。
“2025年我们讲‘物理AI的未来’,2026年我们要解决‘如何让未来发生’。”黄仁勋在演讲中直言,过去一年AI行业的变革远超预期:以DeepSeekR1为代表的开源推理模型下载量爆发式增长,虽比前沿模型慢半年,但每六个月就追近一步——这意味着“推理型AI的普及已经不是‘要不要’,而是‘能不能撑住’”。而此次发布的6款芯片,正是针对推理型AI长期运行的核心痛点:算力架构不匹配、网络互联效率低、上下文难以持续、存储成本高。
算力层:Rubin平台重构“长期推理”底层逻辑
作为此次发布的“核心算力引擎”,Rubin平台被定义为“为推理型AI而生的算力架构”。与2025年的Blackwell芯片侧重训练不同,Rubin平台针对“AI需要持续思考、长期工作”的需求,重新设计了计算单元、内存层级与功耗管理——其目标只有一个:让AI“多想一会(更长上下文)、算得起(更低成本)、跑得久(稳定规模化)”。黄仁勋透露,Rubin平台的单卡推理效率较上一代提升40%,而集群部署后的规模化推理成本降低35%,直接瞄准“智能体24小时工作”的场景需求。
网络层:NVLink6+Spectrum-X打通“数据流动高速路”
推理型AI的另一个瓶颈是“多芯片协同效率”——当AI需要处理百万级token的长上下文时,芯片间的数据传输速度直接决定“思考速度”。此次发布的NVLink6互联技术,将单链路带宽提升至1.6TB/s,较上一代翻番;而搭配Spectrum-X以太网交换机后,整个集群的网络延迟降低50%,吞吐量提升3倍。“以前100个GPU协同推理需要1秒传输数据,现在只要0.3秒。”黄仁勋用通俗的语言解释,“这相当于给AI的‘大脑’装了更粗的‘神经纤维’。”
存储层:推理上下文内存存储平台解决“记忆断层”
“AI为什么不能像人一样‘记住之前的对话’?因为上下文存储成本太高。”黄仁勋直指推理型AI的“记忆痛点”:传统存储架构无法高效保存AI的“思考过程”,每一次上下文切换都要重新加载数据,成本陡增。此次推出的“推理上下文内存存储平台”,通过“分层缓存+实时压缩”技术,将长上下文存储成本降低60%,同时实现“上下文持续保留7天以上”——这意味着,AI智能体可以记住用户一周前的对话细节,无需每次“重新认识”。
模型层:Alpamayo推动“生成式”向“推理式”跃迁
在模型工具层面,英伟达推出Alpamayo、Nemotron、CosmosReason三大推理型模型工具链。其中,Alpamayo被称为“智能体的‘操作系统’”,支持AI从“一次性响应”转向“长期工作”——比如自动驾驶中的AI需要持续观察路况、规划路线、调整策略,Alpamayo能让这些任务在一个模型框架内完成,无需切换多个模块;而CosmosReason则聚焦“物理世界推理”,可将传感器数据(如激光雷达、摄像头)与数字孪生模型结合,让AI理解“真实世界的物理规则”(比如“推一把椅子会移动”)。
数据处理层:BlueField-4支撑“千亿级”基础设施
针对推理型AI的“底层数据处理”,英伟达发布BlueField-4数据处理单元(DPU)。这款芯片支持800Gb/s的网络吞吐量,是上一代的2倍,同时内置AI推理加速单元——这意味着,BlueField-4不仅能“传输数据”,还能“提前处理数据”(比如过滤无用的传感器信息),将前端数据处理效率提升50%,直接减轻后端GPU的负担。黄仁勋强调:“当你有1000台机器人同时运行,BlueField-4能帮你把数据‘挤干水分’,让GPU只算该算的。”
二、从“愿景”到“量产”:最强AI超算GB200NVL72的“性能革命”
在6款芯片的基础上,黄仁勋亮出了此次发布的“终极杀器”——GB200NVL72AI超级计算机。这款被称为“最强推理超算”的系统,由72个GPU通过NVLink6连接而成,其性能较上一代提升10倍,而运行成本降低10倍——这组“10倍”数据,直接刷新了推理型AI超算的“性价比天花板”。
“去年我们展示了Blackwell的训练能力,今年我们要让推理也能‘用得起’。”黄仁勋现场
您可能关注的文档
- 180多名非法移民穿越波白边境.docx
- 2025年云计算架构师考试题库(附答案和详细解析)(1218).docx
- 2025年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(1230).docx
- 2025年计算机视觉工程师考试题库(附答案和详细解析)(1223).docx
- 2026中国硬核科技将再次震撼世界.docx
- 2026年婚姻家庭咨询师考试题库(附答案和详细解析)(0102).docx
- 2026年数据库系统工程师考试题库(附答案和详细解析)(0105).docx
- 2026年整理收纳师考试题库(附答案和详细解析)(0111).docx
- 2026年注册信息安全经理(CISM)考试题库(附答案和详细解析)(0106).docx
- 2026年注册照明设计师考试题库(附答案和详细解析)(0109).docx
- 中国国家标准 GB/Z 37551.300-2026海洋能 波浪能、潮流能及其他水流能转换装置 第300部分:河流能转换装置发电性能评估.pdf
- GB/T 44937.3-2025集成电路 电磁发射测量 第3部分:辐射发射测量 表面扫描法.pdf
- 中国国家标准 GB/T 44937.3-2025集成电路 电磁发射测量 第3部分:辐射发射测量 表面扫描法.pdf
- 《GB/T 44937.3-2025集成电路 电磁发射测量 第3部分:辐射发射测量 表面扫描法》.pdf
- 中国国家标准 GB/T 44937.1-2025集成电路 电磁发射测量 第1部分:通用条件和定义.pdf
- GB/T 44937.1-2025集成电路 电磁发射测量 第1部分:通用条件和定义.pdf
- 《GB/T 44937.1-2025集成电路 电磁发射测量 第1部分:通用条件和定义》.pdf
- 中国国家标准 GB/T 4937.37-2025半导体器件 机械和气候试验方法 第37部分:采用加速度计的板级跌落试验方法.pdf
- 《GB/T 4937.10-2025半导体器件 机械和气候试验方法 第10部分:机械冲击 器件和组件》.pdf
- 中国国家标准 GB/T 44937.2-2025集成电路 电磁发射测量 第2部分:辐射发射测量TEM小室和宽带TEM小室法.pdf
原创力文档

文档评论(0)