- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
正文目录
华为深度拥抱DeepSeek,国产化全面启航 4
英伟达引领全球计算架构持续升级 4
关注华为三月发布新产品 12
投资建议: 15
风险提示 16
图表目录
图表1DeepSeek开源模型时间轴 4
图表2几款主流模型的API价格对比 5
图表3DeepSeek-V3的训练成本 5
图表4主流大模型能力对比 5
图表5R1与其他开源模型对比效果评测 5
图表6华为云发布DeepSeek的推理服务 6
图表7云原生2.0全景图 7
图表8海光“光源”板块 8
图表9燧原科技完成DeepSeek全量模型部署 9
图表10DeepSeek接入应用公司 10
图表11开悟大模型接入DeepSeek 11
图表12华为小艺智能体 12
图表13目前本地化部署提供了6个蒸馏版本 13
图表14端云协同模式 14
图表15华为折叠屏手机概念图 15
图表16华为1+8+N战略 15
请仔细阅读在本报告尾部的重要法律声明
华为深度拥抱DeepSeek,国产化全面启航
国产大模型DeepSeek震撼来袭
DeepSeek是一家中国人工智能公司,成立于2023年7月17日,总部位于浙江杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(LLM)及相关AI技术的研发。简单来说,DeepSeek是一款大语言模型(LLM),主打“极致性价比”。它能写代码、解数学题、做自然语言推理,性能比肩OpenAI的顶尖模型o1,但成本却低到离谱——训练费用仅557.6万美元,是GPT-4o的十分之一,API调用成本更是只有OpenAI的三十分之一。
图表1DeepSeek开源模型时间轴
算法工程笔记,研究所
低训练成本+高性能表现,使得DeepSeek-V3成为国产模型之星。DeepSeek-V3性能表现令人惊叹:不仅全面超越了Llama3.1405B,还能与GPT-4o、Claude
3.5Sonnet等顶尖闭源模型正面竞争。更令人瞩目的是,DeepSeek-V3的API价格
仅为Claude3.5Sonnet的1/15,堪称“性价比之王”。
DeepSeek-V3的预训练阶段在不到两个月内完成,并花费了2664KGPU小时。加上119KGPU小时的上下文长度扩展和5KGPU小时的后训练,DeepSeek-V3的完整训练成本仅为2.788MGPU小时。假设H800GPU的租赁价格为每GPU小时
2美元,总训练成本仅为5.576M美元。
图表2几款主流模型的API价格对比 图表3DeepSeek-V3的训练成本
人工智能AB面,研究所 人工智能AB面,研究所
DeepSeek-R1:首个开源、媲美OpenAIo1的推理大模型。DeepSeek-R1展现出了与OpenAIo1相当甚至在某些方面更优的性能。在MATH基准测试上,R1达到了77.5?的准确率,与o1的77.3?相近;在更具挑战性的AIME2024上,R1的准确率达到71.3?,超过了o1的71.0?。在代码领域,R1在Codeforces评测中达到了2441分的水平,高于96.3?的人类参与者。
DeepSeek-R1成功蒸馏出多个小型推理模型,其中32B70B版本可媲美OpenAIo1-mini。蒸馏后的小模型也取得了优异成绩,如DeepSeek-R1-Distill-
Qwen-7B在AIME2024上得分55.5?,超过QwQ-32B-Preview(参考P6)。
图表4主流大模型能力对比 图表5R1与其他开源模型对比效果评测
腾讯科技,研究所 算法工程师笔记,研究所
国产DeepSeek火爆,高集群能力并非唯一解:根据新智元援引外媒报道,他们在短短两个月时间,在2048个H800GPU集群上,训出6710亿参数的MoE语言模型,比顶尖AI效率高出10倍。
华为深度拥抱DeepSeek,引领国产化浪潮:根据华为云2025年2月1日官网微信公众号,DeepSeek-R1开源后引发全球用户和开发者关注。经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。该服务具备以下特点:得益于自研推理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型可获得持平全球高端GPU
部
您可能关注的文档
- AI大模型提升电视使用体验,智能电视进入新纪元.docx
- AI浪潮下布局什么方向?.docx
- AI行业跟踪报告第54期:比亚迪智驾和华为昇腾驱动强瑞技术快速成长.docx
- AI行业跟踪报告第55期:DeepSeek投资机会梳理.docx
- AI眼镜行业深度:AI眼镜行业,端侧AI赋能持续深化,终端产品有望起量爆发.docx
- A股2024年报前瞻,兼上年同期情况对比.docx
- A股TTM%26全动态估值全景扫描:本周A股估值上升.docx
- A股投资策略周报告:利多因素支持市场稳健运行.docx
- A股行业中观景气跟踪月报:关注新能源和大众消费品量价底部回暖.docx
- DeepSeek固收赋能系列:转债篇.docx
- delta_hes_安装调试手册_zh.pdf
- Mactech_SLC_安装调试手册_TC.pdf
- CQC-C1001-2014-强制性产品认证实施细则-照明电器.pdf
- delta_hes_安装调试手册_en.pdf
- DELTA_IA-PLC_AH Motion Controller_安装调试手册_EN.pdf
- delta_ax-3_安装调试手册_en.pdf
- HEW V.4.09操作说明书手册.pdf
- Delta_Electric-Servo-Press-S-series_安装调试手册_EN.pdf
- E8a 仿真器 操作说明书附加文档 连接 M16C_62P、M16C_6N4、M16C_6N5、M16C_6NK、M16C_6NM、M16C_6NL 和 M16C_6NN 时的注意事项.pdf
- EZ-CUBE 附加手册 (RL78内核).pdf
最近下载
- 2024年湖南工艺美术职业学院单招职业技能测试题库及答案(各地真题).docx VIP
- 每周工作4小时—蒂莫里.费里斯.pdf
- 2024年苏州工业职业技术学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析.docx
- 陕旅版四年级下册英语教案完整版(最全).doc
- 北师大版2024-2025学年一年级数学下册教学工作计划(及进度表).docx
- 2024年湖南科技职业学院高职单招职业技能测验历年参考题库(频考版)含答案解析.docx
- 动画分镜设计.ppt VIP
- 2024年苏州工业职业技术学院单招职业技能测试题库及答案解析.docx
- 大学四级英语单词.doc VIP
- FUNAC发那科 机器人系统高级编程Karel中文版.pdf
文档评论(0)