网站大量收购闲置独家精品文档,联系QQ:2885784924

DeepSeeK开启AI算法变革元年2025-甲子光年.docx

DeepSeeK开启AI算法变革元年2025-甲子光年.docx

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

出品机构:甲子光年智库

研究团队:宋涛、刘瑶、翟惠宇、何伟康、小麦

发布时间:2025.02

1、人工智能的发展已到战略拐点

经过近七十年的发展,人工智能自出现至今其核心能力一直在提升,到如今已经成为覆盖感知、认知、决策、学习、执行、社会协作能力,未来还会向符合人类情感、伦理与道德观念的智能机器迈进。

发展到现在,人工智能的技术能力已经到了一个拐点,即从技术能力驱动向需求应用驱动转型的关键时期。随着技术能力的提升,技术进化引发经济进化,

从旧范式抵达新范式。如今人工智能的发展已经处于从第三阶段向第四阶段过渡的时期。人工智能的能力成长历程已经足够长,到了寻找需求的战略拐点。

技术能力图1:技术革命的周期性示意图

技术能力

第五阶段第一阶段第二阶段第三阶段第四阶段

第五阶段

新产品、新产业的爆炸性增长和迅速创新全部集群(新产业、技术体系和基础设施)

新产品、新产业的爆炸性增长和迅速创新

创新和市场潜力的全面扩张产业范式的颠覆

创新和市场潜力的全面扩张

产业范式的颠覆式创新扩张

新产品和新产业接近成熟,已经构建独立的技术

体系

处位

产业发展

酝酿期构造范式成熟期成长期产业化

酝酿期

构造范式

成熟期

技术新产品、新产业、新技术体系接连出现并持续更新

技术

大爆炸

用得上新技术用得好新技术中国式新技术看得到新技术看得懂新技术

用得上新技术

用得好新技术

中国式新技术

数据来源wwwjazzyear.com

数据来源

wwwjazzyear.com

2

2、算力拐点:DeepSeek的出现,意味着算力效率拐点显现

DeepSeek通过优化算法架构,显著提升了算力利用效率,打破了算力至上的传统认知

训练算力(petaFLOPs)

1.E+12o1GPT-4o1.E+10GeminiUltraGPT-4

1.E+12

o1

GPT-4o

1.E+10

NLG530BPaLM(540B)Claude2Megatron-TuringLlama2-70BBaichuan2-13BBaichuan

NLG530BPaLM(540B)

Claude2

Megatron-Turing

Llama2-70B

Baichuan2-13BBaichuan2-7B

1.E+08

Jli

1.E+06GLM-130B

1.E+06

BERT-LargeTransformerDeepSeek-R1-671B

BERT-Large

Transformer

1.E+04AlexNetDeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Qwen-1.5B

1.E+04

AlexNet

1.E+02

2011201220132014201520172018202120162020202220242025202620232019

2011

2012

2013

2014

2015

2017

2018

2021

2016

2020

2022

2024

2025

2026

2023

2019

年人工智能指数报告》数据来源:3甲子光年智库整理,2025年;wwwjazzyear.com

年人工智能指数报告》

数据来源:

3

2、算力拐点:DeepSeek的出现,意味着算力效率拐点显现

DeepSeek通过重新设计AIInfra,验证“性价比”训练路径

DeepSeek-R1的效果示意:更少的

DeepSeek-R1的效果示意:更少的GPU(或其他AI芯片)带来同样的效果

DeepSeek-R1的惊艳之处是通过重新设计训练流程、以少量SFT数据+

DeepSeek-R1的惊艳之处是通过重新设计训练流程、以少量SFT数据+多轮强化学习的办法,在提高了模型准确性的同时,也显著降低了内存占用和计算开销。

DeepSeek-R1提供了一种低成本训练的方法,而不是说只能通过低成本来进行训练。

反而通过优化,DeepSeek-R1可能

实现了算力与性能的近似线性关系。每增加一张GPU,模型推理能力可

模型效

文档评论(0)

4A方案 + 关注
实名认证
服务提供商

擅长策划,|商业地产|住房地产|暖场活动|美陈|圈层活动|嘉年华|市集|生活节|文化节|团建拓展|客户答谢会

1亿VIP精品文档

相关文档