网站大量收购闲置独家精品文档,联系QQ:2885784924

DeepSeek惊艳世界,算力与应用将迎来结构性变化.pdf

DeepSeek惊艳世界,算力与应用将迎来结构性变化.pdf

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化

目录

引言4

一、DeepSeek-V3、R1模型推出后“火”遍全球4

1.1DeepSeek-V3性能表现不输全球顶尖模型4

1.2R1模型实现了比肩OpenAIo1的推理能力5

1.3DeepSeek-V3、R1模型在产业中引发巨大反响7

二、DeepSeek模型训练与推理技术创新解析8

2.1DeepSeek-V3模型采用了多项创新技术8

2.2R1-Zero与R1模型尝试强化学习边界10

三、DeepSeek将对AI算力与应用产生结构性影响11

3.1DeepSeek模型有望引发算力需求与市场结构变化11

3.2AI应用有望在高性能、低成本模型支撑下繁荣13

四、投资建议与投资标的15

五、风险提示16

2

计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化

图表目录

图1:DeepSeek-V3在多项评测中成绩领先4

图2:DeepSeek-V3在各类测试集上的表现5

图3:DeepSeek-V3API服务价格具备很强的吸引力5

图4:DeepSeek-R1在推理能力上比肩OpenAIo16

图5:基于R1蒸馏的小模型性能超越OpenAIo1-mini6

图6:DeepSeek-R1API服务定价继续大幅低于OpenAIo17

图7:DeepSeek-V3模型训练仅需要278.8万GPU小时训练资源7

图8:DeepSeek成为全球增速最快的AI应用8

图9:DeepSeek发布后下载量增长迅猛8

图10:DeepSeek-V3模型基本架构8

图11:DeepSeek-V3采用FP8为主的混合精度训练方法9

图12:多Token预测(MTP)模块结构示意10

图13:R1-Zero由基础模型直接进行强化学习训练而产生10

图14:DeepSeek-R1-Zero训练期间AIME准确率11

图15:DeepSeek-R1-Zero在RL过程中的平均响应长度(输出长度不断增加)11

图17:“杰文斯悖论”指出成本下降将刺激资源需求更大增长12

图18:硅基流动x华为云联合推出基于昇腾云的DeepSeekR1V3推理服务13

图19:AI产品榜全球Web端访问前15情况(24年12月)14

图20:AI产品榜全球APP端访问前15情况(24年12月)14

图21:2024年全球AI产品付费用户规模14

图22:short-CoT模式下,k1.5模型多方面能力领先15

图23:long-CoT模式下,k1.5模型多方面能力比肩o115

图24:Qwen2.5-Max测试结果领先各类指令模型15

图25:Qwen2.5-Max表现优于各类开源模型15

3

计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化

引言

DeepSeek近期分别发布大模型DeepSeek-v3和推理模型R1,前者在大模型主流榜单的开源模

型中位列榜首,并与世界上最先进的闭源模型不分伯仲;后者性能对标OpenAI的o1正式版,在

数学、代码和自然语言推理等任务上表现卓越。以上两个模型均通过算法和架构的创新,大幅降

低了训练成本和推理成本,为AI技术的普及与创新作出了卓越的贡献。我们认为,DeepSeek呈

现出的算法创新、性能表现、开源属性等多重因素,将对

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档