网站大量收购独家精品文档,联系QQ:2885784924

DeepSeek-R1强势出圈,2025国产AI加速.pdf

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

事件:1月20日,DeepSeek(深度求索)公司发布推理模型DeepSeek-R1正式版,同

步开源模型权重,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

DeepSeek-R1以较低的成本实现了接近OPENAI推理模型O1的性能,上线后热度急剧

攀升,App登顶中国大陆、美国等75个地区的iOS免费榜总榜,网页版访问量也持续

攀升,因用户访问量激增而短暂出现服务器繁忙的状况。DeepSeekAPP成为全球上线

后增速最快的AI原生应用。业内多位技术大牛给予很高的评价,微软、META等海外

科技股业绩会上被多次问及DeepSeek-R1对产业及现有大模型玩家带来的影响。

1、DeepSeek-R1基础情况

根据DeepSeek-R1论文,DeepSeek推出了第一代推理模型DeepSeek-R1-Zero和

DeepSeek-R1。

首次验证了可通过纯强化学习激励大语言模型推理能力,无需监督微调,开发出

DeepSeek-R1-Zero模型。DeepSeek-R1-Zero是通过大规模强化学习(RL)训练而成的模

型,无需监督微调(SFT)作为预备步骤,展现出了卓越的推理能力。通过RL,

DeepSeek-R1-Zero自然地呈现出众多强大且有趣的推理行为。

提出包含冷启动数据和多阶段训练的DeepSeek-R1训练管道,提升模型性能与实用

性。DeepSeek-R1-Zero面临着诸如可读性差和语言混合等挑战,为了解决这些问题并

进一步提升推理性能,DeepSeek引入了DeepSeek-R1,它在RL之前结合了多阶段训练

和冷启动数据。DeepSeek-R1在推理任务上的性能与OpenAI-o1-1217相当。

DeepSeek还开源了DeepSeek-R1-Zero、DeepSeek-R1及基于Qwen和Llama从

DeepSeek-R1蒸馏得到的六个稠密模型(1.5B、7B、8B、14B、32B、70B)。

可改进的方向:1)通用能力:DeepSeek-R1在函数调用、多轮对话、复杂角色扮演和

json输出等任务上的能力尚不及DeepSeek-V3。2)提示工程:DeepSeek-R1对提示非

常敏感,少样本提示会持续降低其性能。DeepSeek建议用户直接描述问题,并在零样

本设置中指定输出格式以获得最佳结果。3)软件工程任务:DeepSeek-R1在软件工程

基准测试中并未显示出比DeepSeek-V3有显著提升。

图:DeepSeek-R1基准测试结果对比openai模型

图:DeepSeek-R1-Zero在训练期间的AIME准确率

2、实测问题:如何分析预测国内AI产业的发展。

DeepSeek-R1在未联网的情况下,回答框架全面且兼具细节,好于其他国产AI竞对表

DeepSeek(深度思考模式,未联网)

豆包(联网)

KIMI(联网)

通义千问(深度搜索)

百度文心一言(文心3.5,联网)

腾讯元宝(深度搜索研究)

智谱(已联网)

openaichatgpt(联网+推理模式)

3、API定价

deepseekr1API价格只需要1元/输入百万tokens(缓存命中)、4元/输入百万tokens

(缓存未命中)、16元/输出百万tokens;相比之下,openai的o1API定价15美金/输

入百万tokens、60美金/输出百万tokens,即使是对比o3-mini定价1.1美金/输入百万

tokens、4.4美金/输出百万tokens,deepseekr1定价也明显更便宜。

deepseekr1API定价

openaio1及o3miniAPI定价

4、后续连锁事件

合作动向

微软迅速将DeepSeek-R1模型添加到其AzureAIFoundry,开发者可以用新模型进

行测试和构建基于云的应用程序和服务。同时微软还将R1的精炼版本引入

“Copilot+PC”,率先提供给搭载骁龙X芯片、英特尔酷睿Ultra200V处理器的PC设备,

然后是搭载AMDRyzenAI9的设备。

AWS宣布用户可以在AmazonBedrock和AmazonSageMakerAI两大AI服务平台

上部署DeepSeek-R1模型。

英伟达上线搭载DeepSeek-R1的软件服务。

硅基流动与华为云推出基于华为云昇腾云服务的DeepSeek

文档评论(0)

偷得浮生半日闲 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档