网站大量收购独家精品文档,联系QQ:2885784924

TMT 行业报告 DeepSeek R1 发布,大模型格局预计发生重大变化(202501).pdfVIP

TMT 行业报告 DeepSeek R1 发布,大模型格局预计发生重大变化(202501).pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

DeepSeekR1发布,大模型格局预计发生重

大变化

报告摘要

2025年1月,国内人工智能初创公司DeepSeek正式发布最新开源模型

DeepSeek-R1,在全球范围引发广泛关注与讨论。目前行业普遍认为DeepSeek

带来了两个里程碑性质的意义:1.算力成本投入表现出来的性能超出行业认知,

用于训练的成本可能大大降低;2.开源路线对大公司闭源路线的底层颠覆。

技术性能卓越DeepSeek-R1采用MIT许可证开源,允许用户通过蒸馏技术训

练其他模型。它的创新性体现在后训练阶段大规模应用强化学习技术,在标注数

据极少的情况下,仍显著提升了模型推理能力。在数学、代码和自然语言推理等

任务中,DeepSeek-R1性能比肩OpenAIo1正式版,在一些第三方测试中表

现优异,如在美国加州大学伯克利分校研究人员设立的聊天机器人竞技场

(chatbotarena)平台上,DeepSeek-R1的性能表现位列前十。

成本优势显著,性价比极高在成本方面,DeepSeek-R1有着无可比拟的优势。

此前发布的DeepSeek-V3仅使用2048颗英伟达H800GPU,就完成了6710亿

参数模型的训练,成本约为560万美元,远低于其他顶级模型的训练成本。而

DeepSeek-R1在运行成本上同样突出,输入费用仅为0.55美元/百万tokens(缓

存未命中),缓存命中时更是低至0.14美元/百万tokens,输出费用仅为2.19美

元/百万tokens。相比之下仅为OpenAIGPT-4o输入费用同等情况下的,这使得

DeepSeek-R1未来可能成为预算敏感企业和团队的首选。

开源模式引领DeepSeek-R1的开源发布在国际AI社区激起千层浪。Meta首席

AI科学家YannLeCun表示,其成功证明了开源模型正超越闭源模型。与

OpenAI限制对其系统的访问以维护竞争优势不同,DeepSeek允许全球企业和

开发者共同开发和改进技术。这种开源策略为开发者提供了更多自由和灵活性,

开发者能根据自身需求对模型进行调整和优化,极大地促进了技术社区的交流与

创新。

突破外部限制,彰显创新力量近年来,美国在芯片等领域对中国实施出口限制,

试图打压中国AI发展。但DeepSeek依然构建出匹敌美国顶尖科技公司的AI

模型。OpenAI前高管扎克・卡斯直言,美国的限制未能阻止DeepSeek的进步,

资源限制反而激发了中国科研人员的创造力。DeepSeek-R1的发布让怀疑论者重

新评估中国的技术发展,也让美国决策者反思通过设置障碍确保领先地位的方法

是否可行。

推荐标的逻辑:AI部署成本降低+运行成本降低,带动AI应用与云服务厂商需求

落增加,建议关注:AI应用落地:美图公司1357.HK、汇量科技1860.HK、第四

范式6682.HK;基础设施:金山云3896.HK、万国数据9698.HK

风险提示:地缘政治风险、技术迭代带来需求和供给变化风险等。

本报告版权属于国证国际证券(香港)有限公司,各项声明请参见报告尾页

1.DeepSeek的核心特点

DeepSeek(深度求索)脱胎于幻方量化,后者作为中国顶尖的量化投资机构,早期储备了大

量GPU算力资源(如10,000块英伟达A100芯片,消息来源“暗涌”公开资料),这为其大

模型研发提供了硬件基础。

在2024年12月26日,Deepseek就发布V3产品,其仅用2.788MH800GPU小时、557万

美元的训练成本,就达到与GPT-4o(训练成本1亿美元)和ClaudeSonnet3.5等顶尖模

型相当的性能,颠覆了人们对大模型训练需要巨额成本的认知。

2025年1月20日仅仅不到一个月,Deepseek发布R1,性能与OpenAI的o1正式版持平并

开源,在ChatbotArena综合榜单上排名第三。公开信息显示,DeepSeek-R1的性能可以与

OpenAI的最新模型相媲美,但其API服务的价格却仅为OpenAI的三十分之一。这一极具

竞争力的定价策略,可能会改变市场格局,迫使其他AI研

您可能关注的文档

文档评论(0)

Seeker研报 + 关注
实名认证
文档贡献者

如果有被下架的,可以私我发你,欢迎垂询各种研究报告!也可以咨询定制获取特定主题报告,欢迎光临!

1亿VIP精品文档

相关文档