TMT 行业报告 DeepSeek R1 发布，大模型格局预计发生重大变化(202501).pdfVIP

下载本文档

0
0
约4.43千字
约 3页
2025-03-12 发布于北京
举报
版权申诉

TMT 行业报告 DeepSeek R1 发布，大模型格局预计发生重大变化(202501).pdf

1、本文档共3页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

DeepSeekR1发布，大模型格局预计发生重

大变化

报告摘要

2025年1月，国内人工智能初创公司DeepSeek正式发布最新开源模型

DeepSeek-R1，在全球范围引发广泛关注与讨论。目前行业普遍认为DeepSeek

带来了两个里程碑性质的意义：1.算力成本投入表现出来的性能超出行业认知，

用于训练的成本可能大大降低；2.开源路线对大公司闭源路线的底层颠覆。

技术性能卓越DeepSeek-R1采用MIT许可证开源，允许用户通过蒸馏技术训

练其他模型。它的创新性体现在后训练阶段大规模应用强化学习技术，在标注数

据极少的情况下，仍显著提升了模型推理能力。在数学、代码和自然语言推理等

任务中，DeepSeek-R1性能比肩OpenAIo1正式版，在一些第三方测试中表

现优异，如在美国加州大学伯克利分校研究人员设立的聊天机器人竞技场

(chatbotarena)平台上，DeepSeek-R1的性能表现位列前十。

成本优势显著，性价比极高在成本方面，DeepSeek-R1有着无可比拟的优势。

此前发布的DeepSeek-V3仅使用2048颗英伟达H800GPU，就完成了6710亿

参数模型的训练，成本约为560万美元，远低于其他顶级模型的训练成本。而

DeepSeek-R1在运行成本上同样突出，输入费用仅为0.55美元/百万tokens（缓

存未命中），缓存命中时更是低至0.14美元/百万tokens，输出费用仅为2.19美

元/百万tokens。相比之下仅为OpenAIGPT-4o输入费用同等情况下的，这使得

DeepSeek-R1未来可能成为预算敏感企业和团队的首选。

开源模式引领DeepSeek-R1的开源发布在国际AI社区激起千层浪。Meta首席

AI科学家YannLeCun表示，其成功证明了开源模型正超越闭源模型。与

OpenAI限制对其系统的访问以维护竞争优势不同，DeepSeek允许全球企业和

开发者共同开发和改进技术。这种开源策略为开发者提供了更多自由和灵活性，

开发者能根据自身需求对模型进行调整和优化，极大地促进了技术社区的交流与

创新。

突破外部限制，彰显创新力量近年来，美国在芯片等领域对中国实施出口限制，

试图打压中国AI发展。但DeepSeek依然构建出匹敌美国顶尖科技公司的AI

模型。OpenAI前高管扎克・卡斯直言，美国的限制未能阻止DeepSeek的进步，

资源限制反而激发了中国科研人员的创造力。DeepSeek-R1的发布让怀疑论者重

新评估中国的技术发展，也让美国决策者反思通过设置障碍确保领先地位的方法

是否可行。

推荐标的逻辑：AI部署成本降低+运行成本降低，带动AI应用与云服务厂商需求

落增加，建议关注：AI应用落地：美图公司1357.HK、汇量科技1860.HK、第四

范式6682.HK；基础设施：金山云3896.HK、万国数据9698.HK

风险提示：地缘政治风险、技术迭代带来需求和供给变化风险等。

本报告版权属于国证国际证券（香港）有限公司，各项声明请参见报告尾页

1.DeepSeek的核心特点

DeepSeek（深度求索）脱胎于幻方量化，后者作为中国顶尖的量化投资机构，早期储备了大

量GPU算力资源（如10,000块英伟达A100芯片，消息来源“暗涌”公开资料），这为其大

模型研发提供了硬件基础。

在2024年12月26日，Deepseek就发布V3产品，其仅用2.788MH800GPU小时、557万

美元的训练成本，就达到与GPT-4o(训练成本1亿美元）和ClaudeSonnet3.5等顶尖模

型相当的性能，颠覆了人们对大模型训练需要巨额成本的认知。

2025年1月20日仅仅不到一个月，Deepseek发布R1，性能与OpenAI的o1正式版持平并

开源，在ChatbotArena综合榜单上排名第三。公开信息显示，DeepSeek-R1的性能可以与

OpenAI的最新模型相媲美，但其API服务的价格却仅为OpenAI的三十分之一。这一极具

竞争力的定价策略，可能会改变市场格局，迫使其他AI研

您可能关注的文档

文档评论（0）

Seeker研报 + 关注: 实名认证

文档贡献者

如果有被下架的，可以私我发你，欢迎垂询各种研究报告！也可以咨询定制获取特定主题报告，欢迎光临！

咨询Ta 进入空间

1亿VIP精品文档

更多 >

TMT 行业报告 DeepSeek R1 发布，大模型格局预计发生重大变化(202501).pdfVIP