网站大量收购独家精品文档,联系QQ:2885784924

电子行业动态分析:存储板块再迎曙光,DeepSeek加速端侧AI规模化转折点,大厂再现控产.docx

电子行业动态分析:存储板块再迎曙光,DeepSeek加速端侧AI规模化转折点,大厂再现控产.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

1、供需:需求侧端侧AI全面开花,供给侧大厂再现控产,存储板块或再迎曙光

需求:DeepSeek降本增效促AI端侧渗透,催生中小容量/超高带宽存储

DeepSeek降本增效,加速端侧AI普及。DeepSeek推动训练和推理成本指数级下降,且大模型蒸馏出的小模型效果提升显著,AI应用的迭代成本下降,边端侧模型可用性明显提高,降低大模型对边端算力需求门槛、降低应用成本、提升边端大模型性能和准确性,搭载在边缘算力(边缘机房1-20台服务器、边缘云)、终端(如AI监控摄像头、智能无人机、智能家居、智能眼镜、智联汽车等)的AI模型及泛AI应用将全面受益,有望加速边缘和端侧AI的普及发展,催生多元化应用。

表1:DeepSeek核心版本迭代更新

版本 原理 重要功能 特点 关键指标提升

版本 原理 重要功能 特点 关键指标提升

DeepSeekV1

DeepSeekV2

DeepSeekV3

DeepSeekR1

将多头查询[Q]分组共享键值[K/V],减少显存占用

在潜在空间压缩注意力头维度[如64维

→32维],通过低秩分解减少计算量熵最大化路由:约束路由器输出的熵值,自然分散专家负载br梯度掩码:对过载

专家暂停梯度更新,促使其“冷却”动态路由架构:根据输入类型[文本/代码

/数学]自动切换模型分支

混合精度推理:FP16用于注意力计算,

INT4用于FFN层,延迟降低35%

基本沿用LLaMA

提出DeepSeekMoEMLA压缩KV减少缓存

MoE负载均衡优化引入MTP技术

冷启动问题的强化学习

奠定基础GQA+多阶段训练

效率革命MoE+潜在注意力

负载均衡新范式无辅助损失均衡

全能选手动态路由+混合精度

训练速度

+20%

推理成本

-50%

专家利用率

+24%

综合任务得分

+15%

讯云开发者、

容量/带宽/能耗及散热为本地部署三大难题。边缘设备导入生成式AI时通常会面临以下问题:(1)存储容量限制:以LLama27B大型语言模型为例,即便在优化至INT8精度时,也至少需要7GB的内存容量来支撑其运行,而在进一步压缩至INT4精度下,内存需求仍高达3.5GB。(2)数据传输带宽不足:当前主流AI手机普遍采用LPDDR5内存,其带宽约为

68GB/s。未来虽有LPDDR6预期的150GB/s带宽提升,但可能仍不足以满足高端AI应用的需求。而HBM虽性能卓越,却因成本与功耗过高,难以在边缘设备中普及应用;(3)能耗和散热挑战:运行复杂的生成式AI模型相较一般应用会产生大量计算热量。因此,边缘设备需要设计有效的能源管理和散热系统,以平衡性能与消耗,确保设备运行的稳定性和经济性。边缘计算更加注重实时处理、实时响应的能力,因此市场上催生了对中小容量、超高带宽内存解决方案的需求。

CUBE或为边缘AI理想内存方案。从CUBE的结构来看,是将SoC裸片置上,DRAM裸片置下,省去SoC的TSV工艺。采用华邦电子CUBE解决方案,SoC裸片尺寸缩小,成本相应降低,同时通过DRAMTSV工艺,可将SoC信号引至外部,使它们成为同一个封装芯片。DRAM做TSV的好处是其裸片将会变得很薄,尺寸变得更小。SoC裸片置上也可以带来更好散热效果,满足现在AI高算力需求。与市面上现有方案相比,CUBE的中小容量超高带宽的特点极具差异化,适用于机器人、可穿戴设备、边缘服务器等多种高级应用。在带宽方面,CUBE能够达到256GB/s-1TB/s,相当于HBM2或4-32个LPDDR4x4266Mbpsx16IO,同时功耗低于1pJ/bit,提供超高带宽的同时可极大降低功耗。此外,CUBE还可作为末级缓存使用,大幅减少SoC背负高容量SRAM的压力,降低整体成本。

图1:华邦电子CUBE解决方案

邦电子、

供给:供给侧大厂再现控产,三星预计Q2存储需求开始恢复

NAND:NAND厂商重启减产策略以调节市场供需关系和稳定存储市场价格。美光表示将降低资本支出并削减晶圆产量,预计NAND产量约减少10%且FQ2-25(2024.11~2025.02)NAND出货量仍将环比下降。三星和SK海力士选择对现有产线进行制程转换,此时需引进并安装新装备,设备无法运行,晶圆产量将有所减少,进而达到自然减产的效果。根据《朝鲜日报》消息,三星决定将中国西安工厂NAND月产量从20万片降至约17万片,韩国华城的12号和17号产线也将

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档