AI进入新临界点.pdfVIP

  • 0
  • 0
  • 约1.47万字
  • 约 10页
  • 2026-02-04 发布于辽宁
  • 举报

本周观点

Agent生态持续扩张。1)大模型公司Anthropic大幅上调未来数年的营收预测,预计今年销售额将增长四倍,达180

亿美元,而明年将达550亿美元。其AI编码助手ClaudeCode去年11月的年化收入已超过10亿美元。2)1月27日

月之暗面发布并开源K2.5模型,最大亮点在于Agent集群。K2.5能根据任务需求,现场调度多达100个分身,并行

处理1500个步骤。3)AI助手Clawdbot近期爆火,不仅吸引大量开发者尝试,更引来腾讯云、阿里云等国内云厂商

火速接入。Clawdbot能接管个人终端几乎所有任务。可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值

机等等,并且可以接入用户常用的聊天APP,通过WhatsApp、Telegram等平台发送指令。Clawdbot带来的“贾维斯”

式的未来人机交互体验,为Agent形式打开了新的思路。

Agent驱动的强化学习(RL)时代,CPU可能比GPU更早成为瓶颈。与传统单任务RL不同,现代Agent系统需

要同时运行成百上千个独立环境实例,环境并行化让CPU成为事实上的第一块短板。主要源于三大核心逻辑:

1)Multi-Agent带来OS调度压力,Agent的“推理-执行-反思”循环机制需要操作系统层面频繁调度,且沙盒

(Sandbox)的运行高度依赖CPU算力。2)为解决长上下文导致的GPU显存容量问题,业界采用KVCache

Offload技术将数据迁移至CPU内存,这不仅要求CPU具备大内存,还需其承担繁重的调度与传输任务。3)

高并发工具调用:检索、编码、网页浏览等非模型推理任务上由CPU执行,在高并发场景下,多线程/多进程的

处理需求推高了CPU的负载。

DeepSeekEngram架构或进一步推动以存代算。DeepSeek推出Engram架构,把大模型里的“计算”和“超

大规模记忆”解耦,Transformer的算子全部在GPU/加速卡上计算,而1000亿参数的Engram表存储运行则在

CPU内存中。此外Anthropic推出的ClaudeCowork,通过知识库为Claude设计的一种全新永久记忆方式。我

们认为,类Engram架构能有效突破GPU显存限制,从而推动以存代算需求和CPU配比提升。

Agent驱动存储需求持续增长。近期美国存储厂商陆续披露亮眼业绩。Agent的执行过程需要记忆以及上下文缓

存,对存储带来了巨大需求。三星发布白皮书深入探讨了AgenticAI时代,利用SSD进行KVCacheOffloading,

可以解决GPU显存瓶颈、提高推理性能并降低成本。在Agent环境中,多轮对话需反复处理相似提示词。若KV

缓存仅存于GPU本地,会话迁移时需重新预填充,引入高延迟。通过将KV缓存卸载至SSD等共享存储,可实

现跨节点快速恢复。

投资建议

相关标的:

海外算力/存储:中际旭创、新易盛、兆易创新、大普微、中微公司、天孚通信、源杰科技、胜宏科技、景旺电子、

英维克等;闪迪、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。

国内算力:寒武纪、东阳光、海光信息、协创数据、华丰科技、星环科技、网宿科技、首都在线、神州数码、百

度集团、大位科技、润建股份、中芯国际、华虹半导体、中科曙光、润泽科技、浪潮信息、东山精密、亿田智能、

奥飞数据、云赛智联、瑞晟智能、科华数据、潍柴重机、金山云、欧陆通、杰创智能。

CPU:海光信息、中科曙光、澜起科技、禾盛新材、中国长城、龙芯中科、兴森科技、深南电路、宏和科技、广

合科技。

风险提示

行业竞争加剧的风险;技术研发进度不及预期的风险;特定行业下游资本开支周期性波动的风险。

敬请参阅最后一页特别声明1

扫码获取更多服务

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档