【东吴-2026研报】半导体行业深度报告:Agentic AI时代的算力重构:CPU,从“旁观者”到“总指挥”的价值回归.pdfVIP

  • 0
  • 0
  • 约2.25万字
  • 约 14页
  • 2026-01-29 发布于广东
  • 举报

【东吴-2026研报】半导体行业深度报告:Agentic AI时代的算力重构:CPU,从“旁观者”到“总指挥”的价值回归.pdf

证券研究报告·行业深度报告·半导体

半导体行业深度报告

AgenticAI时代的算力重构:CPU,从“旁观2026年01月28日

者”到“总指挥”的价值回归

证券分析师陈海进

增持(维持)执业证书:S0600525020001

chenhj@

[Table_Tag]

[Table_Summary]证券分析师李雅文

投资要点

执业证书:S0600526010002

◼从对话模型到行动智能体:Agent架构重塑CPU与GPU分工:市场认

liyw@

为AI算力=GPU,CPU只是负责调度。但AI落地方向来到Agent,由

“纯对话”转向“执行任务”时,算力需求发生了结构性分化。1)执行

控制流CPU化:Agent的行动阶段是大量if/else判断与系统调用。Manus行业走势

等主流Agent架构为每个Agent/任务分配一个隔离的云端虚拟机,不同半导体沪深300

任务在逻辑上高度异构(如网页浏览、代码修改、环境部署等),任务之72%

间可并行但控制流完全不同。分支类任务不适合由GPU执行,因控制64%

56%

48%

流发散导致算力利用率急剧下降。而分支类任务却正是CPU微架构长40%

32%

期优化的主战场。2)记忆体系去GPU化:在Agent场景下,长上下文24%

16%

推理会产生巨大的KVcache,其占用随对话轮次与上下文长度线性增8%

0%

长,快速耗尽GPUHBM容量。而CPU搭配大容量DDR5/LPDDR5-8%

2025/2/52025/6/32025/9/292026/1/25

(并通过CXL扩展)承载KVCache与部分参数,正在成为兼顾吞吐、

扩展性与成本效率的主流架构选择。

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档