- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
DeepSeekR1发布,大模型格局预计发生重
大变化
报告摘要
2025年1月,国内人工智能初创公司DeepSeek正式发布最新开源模型
DeepSeek-R1,在全球范围引发广泛关注与讨论。目前行业普遍认为DeepSeek
带来了两个里程碑性质的意义:1.算力成本投入表现出来的性能超出行业认知,
用于训练的成本可能大大降低;2.开源路线对大公司闭源路线的底层颠覆。
技术性能卓越DeepSeek-R1采用MIT许可证开源,允许用户通过蒸馏技术训
练其他模型。它的创新性体现在后训练阶段大规模应用强化学习技术,在标注数
据极少的情况下,仍显著提升了模型推理能力。在数学、代码和自然语言推理等
任务中,DeepSeek-R1性能比肩OpenAIo1正式版,在一些第三方测试中表
现优异,如在美国加州大学伯克利分校研究人员设立的聊天机器人竞技场
(chatbotarena)平台上,DeepSeek-R1的性能表现位列前十。
成本优势显著,性价比极高在成本方面,DeepSeek-R1有着无可比拟的优势。
此前发布的DeepSeek-V3仅使用2048颗英伟达H800GPU,就完成了6710亿
参数模型的训练,成本约为560万美元,远低于其他顶级模型的训练成本。而
DeepSeek-R1在运行成本上同样突出,输入费用仅为0.55美元/百万tokens(缓
存未命中),缓存命中时更是低至0.14美元/百万tokens,输出费用仅为2.19美
元/百万tokens。相比之下仅为OpenAIGPT-4o输入费用同等情况下的,这使得
DeepSeek-R1未来可能成为预算敏感企业和团队的首选。
开源模式引领DeepSeek-R1的开源发布在国际AI社区激起千层浪。Meta首席
AI科学家YannLeCun表示,其成功证明了开源模型正超越闭源模型。与
OpenAI限制对其系统的访问以维护竞争优势不同,DeepSeek允许全球企业和
开发者共同开发和改进技术。这种开源策略为开发者提供了更多自由和灵活性,
开发者能根据自身需求对模型进行调整和优化,极大地促进了技术社区的交流与
创新。
突破外部限制,彰显创新力量近年来,美国在芯片等领域对中国实施出口限制,
试图打压中国AI发展。但DeepSeek依然构建出匹敌美国顶尖科技公司的AI
模型。OpenAI前高管扎克・卡斯直言,美国的限制未能阻止DeepSeek的进步,
资源限制反而激发了中国科研人员的创造力。DeepSeek-R1的发布让怀疑论者重
新评估中国的技术发展,也让美国决策者反思通过设置障碍确保领先地位的方法
是否可行。
推荐标的逻辑:AI部署成本降低+运行成本降低,带动AI应用与云服务厂商需求
落增加,建议关注:AI应用落地:美图公司1357.HK、汇量科技1860.HK、第四
范式6682.HK;基础设施:金山云3896.HK、万国数据9698.HK
风险提示:地缘政治风险、技术迭代带来需求和供给变化风险等。
本报告版权属于国证国际证券(香港)有限公司,各项声明请参见报告尾页
1.DeepSeek的核心特点
DeepSeek(深度求索)脱胎于幻方量化,后者作为中国顶尖的量化投资机构,早期储备了大
量GPU算力资源(如10,000块英伟达A100芯片,消息来源“暗涌”公开资料),这为其大
模型研发提供了硬件基础。
在2024年12月26日,Deepseek就发布V3产品,其仅用2.788MH800GPU小时、557万
美元的训练成本,就达到与GPT-4o(训练成本1亿美元)和ClaudeSonnet3.5等顶尖模
型相当的性能,颠覆了人们对大模型训练需要巨额成本的认知。
2025年1月20日仅仅不到一个月,Deepseek发布R1,性能与OpenAI的o1正式版持平并
开源,在ChatbotArena综合榜单上排名第三。公开信息显示,DeepSeek-R1的性能可以与
OpenAI的最新模型相媲美,但其API服务的价格却仅为OpenAI的三十分之一。这一极具
竞争力的定价策略,可能会改变市场格局,迫使其他AI研
您可能关注的文档
- 2025年春节假期楼市报告.pdf
- 2025年商业地产行业展望-迎接发展拐点-把握时代机遇.pdf
- AI动态跟踪系列(四):DeepSeek引发广泛关注,大模型应用落地将加速.pdf
- AI事件点评:DeepSeek发布高性价比开源模型,有望拉平模型差距、加速AI云与应用发展.pdf
- DeepSeek 15天指导手册——从入门到精通.pdf
- DeepSeek-Coder当大型语言模型遇到编程-代码智能的兴起(EN).pdf
- DeepSeek概念引爆AI主线,科技板块轮动延续-北交所市场点评.pdf
- kpmg-全球财务智能化调研报告 2025 -人工智能赋能财务,迈向新时代.pdf
- RTE和AI融合生态洞察报告2024-RTE&InfoQ.pdf
- TMT行业周报(2月第1周):DeepSeek出圈,建议关注国内AI产业链.pdf
- 变中求进-2024 国央企数字化转型发展研究报告.pdf
- 医药-从国别竞争力看2025年中国创新药供需及投资机会.pdf
- 英特尔工业人工智能白皮书2025年版-边缘AI驱动助力新质生产力.pdf
- 友望数据-视频号中老年用户消费洞察报告(202501).pdf
- 债券研究-【债券深度报告】2025年信用债年度投资策略:明辨风云,稳健行舟(202412).pdf
- 中国人形机器人:因长期可预见性增强而延展目标价基础至2030年;买入三花_贝斯特;上调绿的谐波_鸣志至中性.pdf
- 中国药品知识产权保护发展状况报告(2023年).pdf
- 中国珠宝玉石首饰行业协会:2023年中国珠宝行业发展报告.pdf
文档评论(0)