- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
m民生证券
m
MINSHENGSECURITIES 行业深度研究/计算机
目录
DeepSeek给予云厂商低门槛部署杀手级〃应用机会,市场需求有望迎来广阔机遇 3
1.1包]叙
1.1包]叙支外為构:J31彳专纟充内算力并瓦5页
3
^
^
1.2DeepSeek突破硬件限制,算力卖铲人〃市场全面打开 5
云厂商是DeepSeek能力的放大器〃:充足的算力弹药〃与用户覆盖能力 8
海量算力的重新定价拉开算力平价时代序幕 8
云厂商平台优势明显,阈值上限再度打开 10
云服务厂商成为心向往之 12
重点公司梳理 15
3.1山知名独立7x
3.1
山知名独立7x1艮
15
优刻#辱:国产方案+全线云产品积淀 16
顺网科技:国内边缘算力领军者 16
网宿科技:专注边缘计算+全球音P署 17
深信服:混合云架构+全渠道战略 18
青云科技:混合云先行者+智算生态矩阵 19
^三六零:专家协{乍模型云t办同+AI安全护 20
^
金山办公:云办公行业领先者发挥新质生产力作用 21
虽石网络:以云为重,终端+AI的两翼齐飞 22
软通动力:天璇AI平台获DeepSeek优化能力跃迁 23
科大讯飞:讯飞星火深耕AI教育领域 24
4M险是$ 26
插图S录 27
雜银 27
本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 2
m民生证券
m
MINSHENGSECURITIES 行业深度研究/计算机
DeepSeek给予云厂商低门滥部署〃杀手级〃应
用机会,市场需求有望迎来广阔机遇
创新技术架构:打破传统内存和算力瓶颈
DeepSeek通过多方面创新实现在低算力的同时性能优异。DeepSeek模型对算力要求相比以往大模型大幅降低,主要得益于其在架构设计、训练策略、算法优化以及硬件适配等多方面的创新。
多头潜注意力(MLA)、深度求索混合专家系统(DeepSeekMoE)的创新架构显著降低训练和推理时的内存占用和计算量。传统计算方式存在对KV矩阵重复计算的问题,这不仅浪费了大量的计算资源,还会导致显存消耗过大,影响模型的运行效率。而MLA技术巧妙地解决了这个难题,它通过独特的算法设计,减少了对KV矩阵的重复计算,大大降低了显存的消耗。而MOE技术将模型分解为多个专家模型和一个门控网络,门控网络根据输入数据的特点,智能地选择合适的专家模型来处理,这样不仅减少了知识冗余,还提高了参数利用效率。在自然语言处理的语言模型任务中,使用MOE结构的DeepSeek模型可以用相对较少的参数,保持甚至提升语言生成的质量,同时显著降低训练和推理时的内存占用和计算量,根据CSDN,DeepSeekMoE在保持性能水平的同时,实现了相较传统MoE模型40%的计算开销降低。
图1:MLA及DeepSeekMOE基础架构
-IOOOO OOOOI
-
OutputHiddenh|
a
)SharedExpert
Feed-ForwardNetworkr
Q0QQ-0I3
IOOOO OOOOIInputHiddenu
Multi-HeadLatentAttention(MLA)
(?i
[??]CachedDuringInference
OutputHiddenuIOOOO-OOOOI
IQOS)
IQOS) ^k^;k^n|otel
con”cotenatel concoffnorrt
(qfj
IOOOOllatentctq
f
LatentcfM????l
1
InputHiddenhfIOOOOOOOOI
资料来源:DeepSeek-V3论文,民生证券研究院
DeepSeek-R1在继承了V3的创新架构的基础上,在后训练阶段大规模使用
了强化学习技术,自动选择有价值的数据进行标注和训练,减少数据标注量和计算
本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告
m民生证券
m
MINSHENGSECURITIES 行业深度研究/计算机
资源浪费,并在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,DeepSeek在AIME2024测评中上获得79.8%的pass@1得分,略微超过OpenAI-o1;在MATH-500上,获得了97.3%的得分,与OpenAI-o1性能相当,并且显著优于其他模型。。
图2:DeepSeek-R1系列模型性能对比
t
S40-
AIME2024 Co
您可能关注的文档
- 人工智能(AI)大语言模型DeepSeek教程系列-清华大学第四弹-DeepSeek+DeepResearch:让科研像聊天一样简单.docx
- 2025年公安辅警招聘笔试真题及答案.docx
- 2025年农产品质量安全检测考试题及答案.docx
- 2025年内审员培训试题(含答案).docx
- 2025年安徽警官职业学院单招语文测试题库有答案.docx
- 2025年宜昌科技职业学院单招(语文)测试题库及参考答案1套.docx
- 2025年安阳职业技术学院单招(语文)测试题库必考题.docx
- 2025年宝鸡中北职业学院单招语文测试模拟题库往年题考.docx
- 2025年宜昌科技职业学院单招语文测试模拟题库精编.docx
- 2025年注册消防工程师之消防安全技术实务题库及参考答案(模拟题).docx
- 保密教育线上培训知识试题库附含答案.docx
- 2025年社区网格员招录考试真题库及参考答案(典型题).docx
- 2025年注册消防工程师之消防安全技术实务题库及精品答案.docx
- 2025年中级银行从业资格之中级银行业法律法规与综合能力真题含完整答案.docx
- 2025年注册消防工程师之消防安全技术实务题库及参考答案【典型题】.docx
- 中级经济师考试保险专业知识与实务考前突破卷及答案.docx
- 2025年注册消防工程师之消防安全技术实务题库及参考答案(综合卷).docx
- 2025年全国保密教育线上培训考试试题库附完整答案(夺冠)带答案详解.docx
- 2025年试题全国保密教育线上培训考试题库及答案解析.docx
- 中级社会工作者综合能力考试题及答案.docx
最近下载
- 2025年广东省基层住院医师线上岗位培训(口腔学)专业课答案(1-2).docx
- 2025年设备监理师《设备工程质量管理与检验》考前点题卷一.docx VIP
- 六西格玛案例之优化电池烘烤工艺.pptx VIP
- 机动车驾驶人考试员相关规定幻灯片.ppt
- 设备使用管理标准.pptx VIP
- 16D303-2常用风机控制电路图.doc
- 《七大浪费分析与改善》培训.ppt VIP
- 人教版《义务教育教科书数学》教材培训.ppt VIP
- 2025年设备监理师《设备工程质量管理与检验》模拟试卷二.docx VIP
- 青岛科技大学2022-2023学年第2学期《高等数学(下)》期末试卷(B卷)附标准答案.pdf
文档评论(0)