英伟达1400亿“收购”，GPU拐点已现？.docxVIP

下载本文档

1
0
约2.72千字
约 6页
2026-01-05 发布于江苏
举报

英伟达1400亿“收购”，GPU拐点已现？.docx

英伟达1400亿“收购”，GPU拐点已现？

一、圣诞夜的算力变局：英伟达史上最大投资落子非GPU赛道

2025年12月25日，全球AI算力产业迎来标志性事件——英伟达宣布以200亿美元（约合1400亿元人民币）现金与Groq达成非排他性技术授权协议，这一金额相当于其现金及短期持有资本（606亿美元）的三分之一，也是该公司成立以来规模最大的一笔投资。交易核心并非收购Groq实体，而是获取其独创的“可重构数据流架构”（LPU）知识产权，并吸纳谷歌“TPU芯片”缔造者乔纳森·罗斯（JonathanRoss）带领的核心技术团队。

这场“超溢价”交易的背后，是英伟达对非GPU架构技术的迫切需求。作为全球AI算力的“GPU帝国”，英伟达此前凭借H100、GB200等芯片主导了AI模型训练市场，但在AI推理这一快速增长的赛道上，却面临谷歌TPU、GroqLPU等非GPU架构的直接竞争。此次以“三分之一现金”换技术的动作，被业界视为英伟达对“GPU并非AI推理最优解”的间接承认，更标志着非GPU架构在AI算力时代的崛起已不可逆转。

二、从GPU到LPU：非架构为何成为AI推理的“最优解”

在AI算力芯片赛道，“GPU派”与“非GPU派”的分野早已清晰：前者以通用计算能力见长，适合复杂的模型训练；后者以专用架构针对特定任务优化，在推理环节展现出碾压性优势——而Groq的LPU（可重构数据流架构）正是“非GPU派”的标杆性技术。

与传统GPU依赖“内存-计算”频繁交互的架构不同，LPU采用软件定义硬件的可重构数据流设计，通过“静态调度”将计算任务直接映射到硬件电路，彻底消除了内存带宽瓶颈。这种设计带来的核心优势是“确定性执行”：处理大语言模型时，LPU能实现每秒数百个Token的“瞬时”吐字，延迟低至“零波动”，而传统GPU因内存延迟问题，吐字速度往往只能达到每秒数十个Token。更关键的是，LPU的能效比较英伟达GPU提升了10倍——基于14nm工艺的LPU晶圆成本仅约6000美元，远低于采用5nm工艺、成本近1.6万美元的H100芯片。

业内人士直言：“对于AI推理这类‘重复、高并发、低延迟’的任务，可重构数据流架构是当前最好的技术路径，没有之一。”以Groq与“月之暗面”的合作为例，其LPU将开源模型KimiK2的性能提升了40倍，运行Mixtral8x7b模型时的吞吐量更是常规推理服务的4倍。这种“性能+成本”的双重优势，让非GPU架构在推理市场的竞争力远超GPU。

三、AI算力拐点：从训练到推理，非GPU架构崛起

驱动英伟达“ALLIN”非GPU架构的底层逻辑，是AI算力市场的需求拐点——从“以训练为中心”转向“以推理为重”。

英伟达CEO黄仁勋（JensenHuang）年初曾公开表示：“未来AI推理的需求将增长100倍。”这一判断并非空穴来风：随着AI大模型从“实验室”走向“应用端”，文本生成、AI视频合成、实时对话等场景对“推理算力”的需求呈指数级增长。与“一次性”的模型训练不同，推理是“持续、高频”的——一个大模型的推理算力需求，可能是训练的10倍甚至更高。

而在推理赛道，非GPU架构的优势正在快速转化为市场份额。谷歌TPUv5e芯片已在YouTube、Search等服务中承载了超万亿次推理请求，能效比是同档GPU的2.5倍；亚马逊Trainium芯片针对推理优化后，成本较GPU降低了40%。市场机构预测，2026年非GPU架构（包括ASIC、可重构数据流芯片）在AI推理市场的份额将从2025年的15%提升至35%，2027年有望突破50%——这意味着，GPU的“绝对主导”时代正在结束。

四、英伟达的算力野心：从“GPU帝国”到“全架构覆盖”

对于英伟达而言，此次收购Groq并非“放弃GPU”，而是补齐“全算力布局”的最后一块拼图。

作为“AI工厂”（NVIDIAAIFactory）的核心设计者，英伟达的目标是构建“从训练到推理”的全链路算力解决方案：训练环节用GPU（如GB200、VR200）处理复杂计算，推理环节用LPU应对低延迟任务，最终通过“统一架构”将两种技术整合到数据中心中。黄仁勋在交易后表示：“Groq的技术将帮助我们服务更广泛的AI实时工作负载——从自动驾驶的感知系统到金融高频交易，再到智能客服的实时对话，这些场景都需要‘零延迟’的推理能力。”

事实上，英伟达的“全架构”布局早已启动：2025年推出的Blackwell平台（GB200芯片）已将液冷作为标准配置，应对GPU功耗攀升至1200W的问题；2026年即将发布的VeraRubin平台（VR200芯片），更是将GPU的TDP提升至2300W，目标是覆盖更复杂的训练任务。而收购Groq的LPU，则是为了在“低功耗、高并发”的推理赛道建立壁垒，最

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

英伟达1400亿“收购”，GPU拐点已现？.docxVIP