Agentic AI时代的算力重构:CPU,从“旁观者”到“总指挥”的价值回归.pdfVIP

  • 0
  • 0
  • 约1.97万字
  • 约 13页
  • 2026-01-30 发布于湖南
  • 举报

Agentic AI时代的算力重构:CPU,从“旁观者”到“总指挥”的价值回归.pdf

证券研究报告·行业深度报告·半导体

半导体行业深度报告

AgenticAI时代的算力重构:CPU,从“旁观2026年01月28日

者”到“总指挥”的价值回归

增持(维持)

[Table_Tag]

[Table_Summary]

投资要点

◼从对话模型到行动智能体:Agent架构重塑CPU与GPU分工:市场认

为AI算力=GPU,CPU只是负责调度。但AI落地方向来到Agent,由

“纯对话”转向“执行任务”时,算力需求发生了结构性分化。1)执行

控制流CPU化:Agent的行动阶段是大量if/else判断与系统调用。Manus行业走势

等主流Agent架构为每个Agent/任务分配一个隔离的云端虚拟机,不同半导体沪深300

任务在逻辑上高度异构(如网页浏览、代码修改、环境部署等),任务之72%

间可并行但控制流完全不同。分支类任务不适合由GPU执行,因控制64%

56%

48%

流发散导致算力利用率急剧下降。而分支类任务却正是CPU微架构长40%

32%

期优化的主战场。2)记忆体系去GPU化:在Agent场景下,长上下文24%

16%

推理会产生巨大的KVcache,其占用随对话轮次与上下文长度线性增8%

0%

长,快速耗尽GPUHBM容量。而CPU搭配大容量DDR5/LPDDR5-8%

2025/2/52025/6/32025/9/292026/1/25

(并通过CXL扩展)承载KVCache与部分参数,正在成为兼顾吞吐、

扩展性与成本效率的主流架构选择。

相关研究

◼Agent软件基础设施加速落地,CPU多核化与需求放量进入确定性通

《关注AI算力需求快速发展,看好国

道:从实验数据复盘来看,CPU成为AgenticAI的真实瓶颈。研究显

示,在完整的Agent执行链路中,工具处理相关环节(检索、Python/Bash产设备商充分受益》

执行、Web请求等)在CPU上消耗的时间占端到端延迟的比例最高可2025-07-19

达90.6%。在高并发场景下(BatchSize提升至128),CPU端到端延迟

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档