- 0
- 0
- 约1.97万字
- 约 13页
- 2026-01-30 发布于湖南
- 举报
证券研究报告·行业深度报告·半导体
半导体行业深度报告
AgenticAI时代的算力重构:CPU,从“旁观2026年01月28日
者”到“总指挥”的价值回归
增持(维持)
[Table_Tag]
[Table_Summary]
投资要点
◼从对话模型到行动智能体:Agent架构重塑CPU与GPU分工:市场认
为AI算力=GPU,CPU只是负责调度。但AI落地方向来到Agent,由
“纯对话”转向“执行任务”时,算力需求发生了结构性分化。1)执行
控制流CPU化:Agent的行动阶段是大量if/else判断与系统调用。Manus行业走势
等主流Agent架构为每个Agent/任务分配一个隔离的云端虚拟机,不同半导体沪深300
任务在逻辑上高度异构(如网页浏览、代码修改、环境部署等),任务之72%
间可并行但控制流完全不同。分支类任务不适合由GPU执行,因控制64%
56%
48%
流发散导致算力利用率急剧下降。而分支类任务却正是CPU微架构长40%
32%
期优化的主战场。2)记忆体系去GPU化:在Agent场景下,长上下文24%
16%
推理会产生巨大的KVcache,其占用随对话轮次与上下文长度线性增8%
0%
长,快速耗尽GPUHBM容量。而CPU搭配大容量DDR5/LPDDR5-8%
2025/2/52025/6/32025/9/292026/1/25
(并通过CXL扩展)承载KVCache与部分参数,正在成为兼顾吞吐、
扩展性与成本效率的主流架构选择。
相关研究
◼Agent软件基础设施加速落地,CPU多核化与需求放量进入确定性通
《关注AI算力需求快速发展,看好国
道:从实验数据复盘来看,CPU成为AgenticAI的真实瓶颈。研究显
示,在完整的Agent执行链路中,工具处理相关环节(检索、Python/Bash产设备商充分受益》
执行、Web请求等)在CPU上消耗的时间占端到端延迟的比例最高可2025-07-19
达90.6%。在高并发场景下(BatchSize提升至128),CPU端到端延迟
您可能关注的文档
- 金属包装:提价&出海齐头并进,龙头盈利改善可期.pdf
- 2026年传媒行业投资策略报告:AI+IP双轮共振,重构内容产业新生态.pdf
- 电新行业2025Q4公募基金持仓分析.pdf
- 调味品行业深度报告:BC端共振,期待改善.pdf
- 电力设备及新能源行业之电网设备专题报告:铁塔凌云起,智电写春秋.pdf
- 2026年汽车行业投资策略:智能化+全球化驱动,把握结构性机会.pdf
- 免税行业深度报告:高端零售率先复苏,免税景气向好.pdf
- 消费专题报告:估值低位下的结构演绎,聚焦“红利资产”与“情绪消费”.pdf
- 社会服务行业2026年投资策略:消费回暖在即,关注细分赛道复苏节奏.pdf
- 2025年资金面回顾及2026年展望:资金情绪分化,等待新一轮共振.pdf
最近下载
- 《学生寒假规划》PPT班会课件精品公开课比赛.ppt VIP
- 2026湖北中烟工业有限责任公司高校毕业生招聘考试笔试备考题库及答案解析.docx VIP
- ISO3834-2培训.ppt VIP
- 水利水电工程单元工程施工质量检验表与验收表(SLT631.8-2025).docx
- 【船舶固定式气溶胶灭火系统技术要求】.pdf VIP
- 2026年湖北中烟工业有限责任公司高校毕业生招聘(169人)考试笔试参考题库及答案解析.docx VIP
- 厂房消防设计专篇.doc VIP
- SDRSHARP 中文用户指南.pdf VIP
- 船舶固定式气溶胶灭火系统性能要求和试验方法2020-标准全文及编制说明.doc VIP
- ISO 3834-1:2005译文需要的焊接标准.pdf VIP
原创力文档

文档评论(0)