中金公司-软件及服务:人工智能十年展望(二十七):越过“遗忘”的边界,模型记忆的三层架构与产业机遇-260211-31页.pdfVIP

  • 0
  • 0
  • 约4.57万字
  • 约 31页
  • 2026-02-13 发布于北京
  • 举报

中金公司-软件及服务:人工智能十年展望(二十七):越过“遗忘”的边界,模型记忆的三层架构与产业机遇-260211-31页.pdf

证券研究报告2026.02.11

软件及服务

人工智能十年展望(二十七):越过“遗忘”

的边界,模型记忆的三层架构与产业机遇

于钟海分析员韩蕊分析员王之昊分析员

SAC执证编号:S0080518070011SAC执证编号:S0080523070010SAC执证编号:S0080522050001

SFCCERef:BOP246SFCCERef:BXD683SFCCERef:BSS168

zhonghai.yu@rui.han@zhihao3.wang@

纵轴:相对值(%)观点聚焦

沪深300中金软件及服务投资建议

148

大模型的演进史,本质上是一部与“遗忘”抗争的历史。当我们惊

136

叹于模型的推理能力时,往往忽视了一个重要短板:在缺乏记忆留

124

存的架构下,模型每一次对历史信息的处理,本质上都是一次昂贵

112的“重复计算”。这种以高昂算力对抗遗忘的粗放模式,正面临着显

100存墙与上下文窗口的物理极限。我们认为,2026年及之后的AI

88

2025-022025-052025-082025-102026-01Infra主战场将增加“模型记忆”这一极。何为模型记忆?如何理解

短期、中期、长期记忆三层记忆系统对应的软硬件需求?如何对应

模型训练、推理、Agent场景理解记忆分层系统?我们将在本报告

中金一级行业:科技中予以解答。

资料来源:Wind,彭博资讯,中金公司研究部

理由

⚫软件及服务|人工智能十年展望(二十六):2026关键趋

势之模型技术篇(2026.02.03)短期记忆构成大模型单次推理的“当前视野”。作为高频读写、对延

⚫软件及服务|人工智能十年展望(二十五):视频生成拐迟极度敏感的“热数据”,其核心矛盾在于KVCache对显存容量与带

点将至,成长性赛道迎中国机遇(2025.07.31)宽的双重挤占。软件端通过PagedAttention显存虚拟化与PD分离调

⚫软件及服务|人工智能十年展望(二十四):AIAgent元

年已至,应用拐点或将到来(2025.07.17)度进行优化,并探索出无限注意力(Infini-attention)等前沿架构以

⚫软件及服务|AI智道(12):Moltbot/Clawdbot:AIAgent支撑百万Tokens上下文窗口。这一逻辑直接锚定了HBM与片上

交互逻辑持续演化(2026.01.29)SRAM作为突破“显存墙”与“延迟墙”的重要硬件要素。

⚫软件及服务|AI智道(11):通用Agent持续迭代,大模

型应用的“必争之地”(2026.01.21)中期记忆保障跨会话的情景连续性,是Agent的基石。跨会话窗口

的需求标志着AI需要从无状态的短线智能向具备“存储-检索-更

文档评论(0)

1亿VIP精品文档

相关文档