- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
事件:1月20日,DeepSeek(深度求索)公司发布推理模型DeepSeek-R1正式版,同
步开源模型权重,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
DeepSeek-R1以较低的成本实现了接近OPENAI推理模型O1的性能,上线后热度急剧
攀升,App登顶中国大陆、美国等75个地区的iOS免费榜总榜,网页版访问量也持续
攀升,因用户访问量激增而短暂出现服务器繁忙的状况。DeepSeekAPP成为全球上线
后增速最快的AI原生应用。业内多位技术大牛给予很高的评价,微软、META等海外
科技股业绩会上被多次问及DeepSeek-R1对产业及现有大模型玩家带来的影响。
1、DeepSeek-R1基础情况
根据DeepSeek-R1论文,DeepSeek推出了第一代推理模型DeepSeek-R1-Zero和
DeepSeek-R1。
首次验证了可通过纯强化学习激励大语言模型推理能力,无需监督微调,开发出
DeepSeek-R1-Zero模型。DeepSeek-R1-Zero是通过大规模强化学习(RL)训练而成的模
型,无需监督微调(SFT)作为预备步骤,展现出了卓越的推理能力。通过RL,
DeepSeek-R1-Zero自然地呈现出众多强大且有趣的推理行为。
提出包含冷启动数据和多阶段训练的DeepSeek-R1训练管道,提升模型性能与实用
性。DeepSeek-R1-Zero面临着诸如可读性差和语言混合等挑战,为了解决这些问题并
进一步提升推理性能,DeepSeek引入了DeepSeek-R1,它在RL之前结合了多阶段训练
和冷启动数据。DeepSeek-R1在推理任务上的性能与OpenAI-o1-1217相当。
DeepSeek还开源了DeepSeek-R1-Zero、DeepSeek-R1及基于Qwen和Llama从
DeepSeek-R1蒸馏得到的六个稠密模型(1.5B、7B、8B、14B、32B、70B)。
可改进的方向:1)通用能力:DeepSeek-R1在函数调用、多轮对话、复杂角色扮演和
json输出等任务上的能力尚不及DeepSeek-V3。2)提示工程:DeepSeek-R1对提示非
常敏感,少样本提示会持续降低其性能。DeepSeek建议用户直接描述问题,并在零样
本设置中指定输出格式以获得最佳结果。3)软件工程任务:DeepSeek-R1在软件工程
基准测试中并未显示出比DeepSeek-V3有显著提升。
图:DeepSeek-R1基准测试结果对比openai模型
图:DeepSeek-R1-Zero在训练期间的AIME准确率
2、实测问题:如何分析预测国内AI产业的发展。
DeepSeek-R1在未联网的情况下,回答框架全面且兼具细节,好于其他国产AI竞对表
现
DeepSeek(深度思考模式,未联网)
豆包(联网)
KIMI(联网)
通义千问(深度搜索)
百度文心一言(文心3.5,联网)
腾讯元宝(深度搜索研究)
智谱(已联网)
openaichatgpt(联网+推理模式)
3、API定价
deepseekr1API价格只需要1元/输入百万tokens(缓存命中)、4元/输入百万tokens
(缓存未命中)、16元/输出百万tokens;相比之下,openai的o1API定价15美金/输
入百万tokens、60美金/输出百万tokens,即使是对比o3-mini定价1.1美金/输入百万
tokens、4.4美金/输出百万tokens,deepseekr1定价也明显更便宜。
deepseekr1API定价
openaio1及o3miniAPI定价
4、后续连锁事件
合作动向
微软迅速将DeepSeek-R1模型添加到其AzureAIFoundry,开发者可以用新模型进
行测试和构建基于云的应用程序和服务。同时微软还将R1的精炼版本引入
“Copilot+PC”,率先提供给搭载骁龙X芯片、英特尔酷睿Ultra200V处理器的PC设备,
然后是搭载AMDRyzenAI9的设备。
AWS宣布用户可以在AmazonBedrock和AmazonSageMakerAI两大AI服务平台
上部署DeepSeek-R1模型。
英伟达上线搭载DeepSeek-R1的软件服务。
硅基流动与华为云推出基于华为云昇腾云服务的DeepSeek
您可能关注的文档
- DeepSeek 15天指导手册——从入门到精通.pdf
- DeepSeek+DeepResearch:让科研像聊天一样简单.pdf
- DeepSeek核心十问十答.pdf
- DeepSeek核心十问十答20250205.pdf
- DeepSeek行业应用实践-李祖希.pdf
- DeepSeek的投资机会一览20250204.pdf
- 传媒:阿里云的AIDC产业链.pdf
- 大摩宏观闭门会-科创引领中国资产重估?.pdf
- 当总统践踏他宣誓维护的宪法和藐视法院的裁决时.pdf
- 2024年度领导干部个人专题民主生活会、组织生活会对照检查材料(四个带头)和意见建议汇总.docx
- 市直机关工委及个人述职述廉2024年党建工作情况报告材料.docx
- 区委书记在2025年一季度经济运行部署会议上的讲话发言材料.docx
- 市直机关单位、卫健委党支部2024年工作述职报告材料.docx
- 市委副书记、市长在2025年市委城乡规划委员会第一次会议上的讲话发言材料.docx
- 某单位领导干部2024年生活会、组织生活会对照检查材料(对照“四个带头”).docx
- 2024年民政局、宣传部、教育局基层主要领导个人述责述廉报告材料.docx
- 2025年2月党支部“三会一课”参考主题方案.docx
- 在某中学2025年春季开学典礼上的讲话:以“三重境界”燃动新学期.docx
- 2024年度领导干部专题民主生活会、组织生活会对照检查材料(四个带头)及学习研讨会上的发言材料.docx
- 市纪委市监委2025年度纪检监察工作计划.docx
文档评论(0)