计算机行业AI+2026算力系列(四):GTC英伟达升级Agent算力产品,国内AI产业迎来新契机.pptxVIP

  • 1
  • 0
  • 约6.25千字
  • 约 10页
  • 2026-04-24 发布于北京
  • 举报

计算机行业AI+2026算力系列(四):GTC英伟达升级Agent算力产品,国内AI产业迎来新契机.pptx

核心观点:

lGTC大会上,英伟达针对Agent应用展示了多款AI算力新产品。2026年3月16日,英伟达在GTC大会上展示了多款AI算力产品,包括VeraRubinNVL72超节点产品、Groq3LPU和LPX以及NemoClaw等。从其推出的产品方向来看,英伟达在重点加强针对Agent应用在集群化算力和推理算力产品线的竞争力。

l具体看,①与Blackwell架构下的超节点产品相比,VeraRubinNVL72推理性能实现5倍的提升,训练性能实现3.5倍的提升。VeraRubin架构的集群能力的提升有望更好满足科技厂商对于加速万亿参数AI模型、多模态大模型及Agent推理任务的算力需求。②针对Agent推理场景常见的长上下文和低延迟的需求,英伟达推出了专用芯片Groq3LPU。融合了模型和Agent算法原理的LPU专用芯片产品在计算性能上有明显提升,这反映了芯片和算法融合发展的趋势已愈发明显。③针对多智能体协同场景,Dynamo软件栈通过KV-Cache存储优化、大语言模型动态路由以及分步推理技术实现了较好的性能提升。④cuVS向量加速软件栈主要通过加速和优化向量检索和搜索的过程来赋能数据挖掘和语义搜索场景。⑤NemoClaw采用英伟达Agen

文档评论(0)

1亿VIP精品文档

相关文档