网站大量收购独家精品文档,联系QQ:2885784924

DeepSeek掀起国产新浪潮.docx

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

正文目录

华为深度拥抱DeepSeek,国产化全面启航 4

英伟达引领全球计算架构持续升级 4

关注华为三月发布新产品 12

投资建议: 15

风险提示 16

图表目录

图表1DeepSeek开源模型时间轴 4

图表2几款主流模型的API价格对比 5

图表3DeepSeek-V3的训练成本 5

图表4主流大模型能力对比 5

图表5R1与其他开源模型对比效果评测 5

图表6华为云发布DeepSeek的推理服务 6

图表7云原生2.0全景图 7

图表8海光“光源”板块 8

图表9燧原科技完成DeepSeek全量模型部署 9

图表10DeepSeek接入应用公司 10

图表11开悟大模型接入DeepSeek 11

图表12华为小艺智能体 12

图表13目前本地化部署提供了6个蒸馏版本 13

图表14端云协同模式 14

图表15华为折叠屏手机概念图 15

图表16华为1+8+N战略 15

请仔细阅读在本报告尾部的重要法律声明

华为深度拥抱DeepSeek,国产化全面启航

国产大模型DeepSeek震撼来袭

DeepSeek是一家中国人工智能公司,成立于2023年7月17日,总部位于浙江杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(LLM)及相关AI技术的研发。简单来说,DeepSeek是一款大语言模型(LLM),主打“极致性价比”。它能写代码、解数学题、做自然语言推理,性能比肩OpenAI的顶尖模型o1,但成本却低到离谱——训练费用仅557.6万美元,是GPT-4o的十分之一,API调用成本更是只有OpenAI的三十分之一。

图表1DeepSeek开源模型时间轴

算法工程笔记,研究所

低训练成本+高性能表现,使得DeepSeek-V3成为国产模型之星。DeepSeek-V3性能表现令人惊叹:不仅全面超越了Llama3.1405B,还能与GPT-4o、Claude

3.5Sonnet等顶尖闭源模型正面竞争。更令人瞩目的是,DeepSeek-V3的API价格

仅为Claude3.5Sonnet的1/15,堪称“性价比之王”。

DeepSeek-V3的预训练阶段在不到两个月内完成,并花费了2664KGPU小时。加上119KGPU小时的上下文长度扩展和5KGPU小时的后训练,DeepSeek-V3的完整训练成本仅为2.788MGPU小时。假设H800GPU的租赁价格为每GPU小时

2美元,总训练成本仅为5.576M美元。

图表2几款主流模型的API价格对比 图表3DeepSeek-V3的训练成本

人工智能AB面,研究所 人工智能AB面,研究所

DeepSeek-R1:首个开源、媲美OpenAIo1的推理大模型。DeepSeek-R1展现出了与OpenAIo1相当甚至在某些方面更优的性能。在MATH基准测试上,R1达到了77.5?的准确率,与o1的77.3?相近;在更具挑战性的AIME2024上,R1的准确率达到71.3?,超过了o1的71.0?。在代码领域,R1在Codeforces评测中达到了2441分的水平,高于96.3?的人类参与者。

DeepSeek-R1成功蒸馏出多个小型推理模型,其中32B70B版本可媲美OpenAIo1-mini。蒸馏后的小模型也取得了优异成绩,如DeepSeek-R1-Distill-

Qwen-7B在AIME2024上得分55.5?,超过QwQ-32B-Preview(参考P6)。

图表4主流大模型能力对比 图表5R1与其他开源模型对比效果评测

腾讯科技,研究所 算法工程师笔记,研究所

国产DeepSeek火爆,高集群能力并非唯一解:根据新智元援引外媒报道,他们在短短两个月时间,在2048个H800GPU集群上,训出6710亿参数的MoE语言模型,比顶尖AI效率高出10倍。

华为深度拥抱DeepSeek,引领国产化浪潮:根据华为云2025年2月1日官网微信公众号,DeepSeek-R1开源后引发全球用户和开发者关注。经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。该服务具备以下特点:得益于自研推理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型可获得持平全球高端GPU

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档