DeepSeek-R1强势出圈，2025国产AI加速.pdf

下载文档

1
0
约4.06千字
约 27页
2025-02-16 发布于北京
举报
版权申诉
保障服务

DeepSeek-R1强势出圈，2025国产AI加速.pdf

1、本文档共27页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

事件：1月20日，DeepSeek（深度求索）公司发布推理模型DeepSeek-R1正式版，同

步开源模型权重，并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

DeepSeek-R1以较低的成本实现了接近OPENAI推理模型O1的性能，上线后热度急剧

攀升，App登顶中国大陆、美国等75个地区的iOS免费榜总榜，网页版访问量也持续

攀升，因用户访问量激增而短暂出现服务器繁忙的状况。DeepSeekAPP成为全球上线

后增速最快的AI原生应用。业内多位技术大牛给予很高的评价，微软、META等海外

科技股业绩会上被多次问及DeepSeek-R1对产业及现有大模型玩家带来的影响。

1、DeepSeek-R1基础情况

根据DeepSeek-R1论文，DeepSeek推出了第一代推理模型DeepSeek-R1-Zero和

DeepSeek-R1。

首次验证了可通过纯强化学习激励大语言模型推理能力，无需监督微调，开发出

DeepSeek-R1-Zero模型。DeepSeek-R1-Zero是通过大规模强化学习（RL）训练而成的模

型，无需监督微调（SFT）作为预备步骤，展现出了卓越的推理能力。通过RL，

DeepSeek-R1-Zero自然地呈现出众多强大且有趣的推理行为。

提出包含冷启动数据和多阶段训练的DeepSeek-R1训练管道，提升模型性能与实用

性。DeepSeek-R1-Zero面临着诸如可读性差和语言混合等挑战，为了解决这些问题并

进一步提升推理性能，DeepSeek引入了DeepSeek-R1，它在RL之前结合了多阶段训练

和冷启动数据。DeepSeek-R1在推理任务上的性能与OpenAI-o1-1217相当。

DeepSeek还开源了DeepSeek-R1-Zero、DeepSeek-R1及基于Qwen和Llama从

DeepSeek-R1蒸馏得到的六个稠密模型（1.5B、7B、8B、14B、32B、70B）。

可改进的方向：1）通用能力：DeepSeek-R1在函数调用、多轮对话、复杂角色扮演和

json输出等任务上的能力尚不及DeepSeek-V3。2）提示工程：DeepSeek-R1对提示非

常敏感，少样本提示会持续降低其性能。DeepSeek建议用户直接描述问题，并在零样

本设置中指定输出格式以获得最佳结果。3）软件工程任务：DeepSeek-R1在软件工程

基准测试中并未显示出比DeepSeek-V3有显著提升。

图：DeepSeek-R1基准测试结果对比openai模型

图：DeepSeek-R1-Zero在训练期间的AIME准确率

2、实测问题：如何分析预测国内AI产业的发展。

DeepSeek-R1在未联网的情况下，回答框架全面且兼具细节，好于其他国产AI竞对表

现

DeepSeek（深度思考模式，未联网）

豆包（联网）

KIMI（联网）

通义千问（深度搜索）

百度文心一言（文心3.5，联网）

腾讯元宝（深度搜索研究）

智谱（已联网）

openaichatgpt（联网+推理模式）

3、API定价

deepseekr1API价格只需要1元/输入百万tokens（缓存命中）、4元/输入百万tokens

（缓存未命中）、16元/输出百万tokens；相比之下，openai的o1API定价15美金/输

入百万tokens、60美金/输出百万tokens，即使是对比o3-mini定价1.1美金/输入百万

tokens、4.4美金/输出百万tokens，deepseekr1定价也明显更便宜。

deepseekr1API定价

openaio1及o3miniAPI定价

4、后续连锁事件

合作动向

微软迅速将DeepSeek-R1模型添加到其AzureAIFoundry，开发者可以用新模型进

行测试和构建基于云的应用程序和服务。同时微软还将R1的精炼版本引入

“Copilot+PC”，率先提供给搭载骁龙X芯片、英特尔酷睿Ultra200V处理器的PC设备，

然后是搭载AMDRyzenAI9的设备。

AWS宣布用户可以在AmazonBedrock和AmazonSageMakerAI两大AI服务平台

上部署DeepSeek-R1模型。

英伟达上线搭载DeepSeek-R1的软件服务。

硅基流动与华为云推出基于华为云昇腾云服务的DeepSeek

您可能关注的文档

文档评论（0）

偷得浮生半日闲 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

DeepSeek-R1强势出圈，2025国产AI加速.pdf