网站大量收购独家精品文档,联系QQ:2885784924

2025年DeepSeeK开启AI算法变革更新新浪潮.pptx

2025年DeepSeeK开启AI算法变革更新新浪潮.pptx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

2025年DeepSeeK开启AI算法变革更新新浪潮

;

第一阶段;

训练算力(petaFLOPs)

GeminiUltra

G

nvOIA

Megatron-TuringNLG530BPaLM(540B)

T0Uama2-70B

Baichuan2-13B

1.E+08

Baichuan2-78

1.E+06

DeepSeek-R1-671B

TORONTO

DeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Qwen-1.5B

1.E+02

20112012201320142015;

DeepSeek-R1

少GPU数量

备注:该图仅为示意,不代表实际情况下具体数量与效果的对比

“该图为无编码基础分析师通过DeepSeekRI协作利用python编码生成;

高参数量低参数量

DeepSeek-R1-6718.

6710

MiniMax-Text-01.

4560MiniMax-VL-01.4560

DeeSeek-R1-Distil-

Qhen-32B.320

Phi4,140

2025年1月;

AI技术成熟度

?

算法

创新

算力

创新

数据

创新,

时间

2025年;

采用PPO强化学习算法针对奖励模型来优化策略

第三阶段

强化学习优化模里;

Data,Fine-TuningPhases,RLPhases,andDistillationforDeepSeek-R1

GRPO:

l-bard

modelfor

nen-reasoning

Strongreasoning,

restoregeneral

capabitities

Deepseek-v3-

tostart阻

Filter

Thousands

CoTexamples

(uriting,QA)

Qen1.5,7.14,32b

Llam8,70b;

LFM40B

Uama3170B

(A12B)

Qwen257B

A14B

Gemma227B

LFM3B

Mixctral47BA13B

Phi-3.53.8B

LFM

1.3B

2.6B

Lama3.21B

Phi-1.5

●Stable

RecurrentGemma2

2.7B

RWKV6128B

1.38

活跃参数数量

70B100B

▲LFM;

AIPC

74.6%

54.7%

38.0%

28.0%

16.0%

5.0%

338.8

8.1%

190.4

57.0

3

2023;

2024城头变幻大王旗,2025年AI超级应用开始出现,DAU达2161万

为2024年的A超级应用的头把交椅处于不断变动之中。甲子光年智库统计汇总了近13个月中访问量最高的产品访问量数据,发现第一名的Al产品是处于不断变动状态的,可以用一句话来形容。那就是城头变幻大王旗。基本上每个解读的头把交椅都会发生变化。

口2025年的开年,DeepSeek用短短二十天的时间就实现了DAU2161万的数据,超过了ChatGPT发布之处的数据表现,具有成为AI超级应用的潜力。;

5.2

4.7

小米第一代手机(小米手机1)

于2011年8月发布,定价1999

元。

在出货量增长和价格体系两方

面实现重构???高性能+低价格

2.58

0.95

0.4

2010201120122013201420152016;

DeepSeek的“高性价比”有望解锁具身智能的理解与推理

口DS不仅在推理模型上实现了突破,在多模态方面也保持了进步,并于近日开源发布了Janus-Pro多模态模型。

口基于算法工程方面的优化,DS能够实现性价比更高的模型推理能力(价格低、效率高、性能强、可部署在端侧平台),

口DS有望以强大的推理能力和多模态感知能力,重塑机器人交互与决策,同时通过低成本、高效率的解决方案,加速具身智能的普及与应用。

DeepSeek的性价比效率优势,有望加速具身智能技术发展普及

低成本和高效率对于实现规模化应用和商业化至关重要

降低训练成本·以较低的成本训练出高质量的模型

您可能关注的文档

文档评论(0)

资料网上搜索整理 + 关注
实名认证
服务提供商

资料网上搜索整理,资料网上搜索整理,资料网上搜索整理。

1亿VIP精品文档

相关文档