网站大量收购独家精品文档,联系QQ:2885784924

海外科技行业市场前景及投资研究报告:解码DeepSeek开源,超预期开源程度,低成本属性.pdf

海外科技行业市场前景及投资研究报告:解码DeepSeek开源,超预期开源程度,低成本属性.pdf

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

证券研究报告|海外科技|2025年03月16日

海外团队•行业深度报告

超预期的开源程度与低成本属性——解码DeepSeek开源周

摘要

DeepSeek开源周揭示V3/R1在单GPU计算速度、GPU间传输速度及GPU利用率方面的极致提效。2025年2月24日至28日,DeepSeek通

过连续五天的“开源周”活动,开源了Infra关键组件的代码库。具体而言,如果将模型训练和推理简化为计算和通信两大任务,FlashMLA

和DeepGEMM主要专注于提升计算效率,即通过映射向量的降维以及运算位数的下降来减少计算过程中的缓存空间占用,从而提高单位

GPU能实现的计算速度上限。DeepEP则面向通信任务,在MoE架构下采用NVSHMEM来适配频繁的小规模传输需求,提高GPU间通信速

度上限。DualPipe和EPLB负责不同计算与通信子任务之间的灵活调度,通过流水线双向交错执行和热门专家复制等方法来避免子任务分

配不当带来的GPU空置。最后,3FS则是在正式进行计算和通信前,为数据的读取与准备工作提供支持,基于高速缓存与读取架构提升文

件的随机读写效率。

DeepSeekV3/R1推理架构在极致的工程优化下实现高吞吐和低时延,模型推理的理论利润率达到545%。开源周DAY6发布V3/R1推理系

统的概览,用于将前五天开源的各项底层组件整理到推理流程中,通过在整个推理架构贯穿工程细节优化来实现高吞吐和低时延。基于所

有Token(包括Web、App及API端)都按照R1的标准收费、仅考虑2美元/小时GPU租赁成本(未计入折旧、运维、能耗与租金等)的假设,

公司称其模型服务的理论利润率达到545%。

DeepSeek超预期的开源程度与低成本属性为AI应用与云服务兑现带来积极信号。我们在2025年2月4日发布的报告《从算力、应用及终端

层面看DeepSeekR1的影响》中指出,基于DeepSeek开源+低成本属性,AI产业在算力、应用和终端三个维度迎来实质性变革,港股AI资

产也有望迎价值重估。通过这次开源周,我们更清晰地看到DeepSeek正在推动大模型算法向开源、低精度(FP8)、MoE三个方向演进,

同时Infra层面的工程优化相对简单堆料更显重要。随着技术放开带动更多企业和开发者参与AI应用研发,我们继续看好以上三条主线的长

期空间,并且进一步强调算力与应用层的逻辑变化:1)DS开源的技术完全针对NVHopper架构进行深度优化,技术迁移/国产适配需芯片

厂商完善对FP8等特性的支持并相应优化推理侧解决方案;2)超出预期的“低成本”或为云平台算力服务创造更大需求与盈利空间;3)

更大程度的开源为二次定制开发和应用创新提供足够自由度,企业有望充分发挥自身数据和行业know-how优势,龙头受益趋势更为确定。

投资建议:在DSR1发布-腾讯元宝加速落地-阿里云投入超预期-ManusAI发布等多轮催化带动估值上修的背景下,港股有望开启以科

技成长为主线的长线行情,我们看好后续行情的三个演绎方向——1)云服务:阿里巴巴-W、商汤-W、金山云;2)通用应用:腾讯控股;

3)细分场景应用:垂类软件板块,金蝶国际、金山软件、美图-W、迈富时、明源云;内容娱乐板块,快手-W、哔哩哔哩-W、网易-W、

阅文集团。

2

摘要

阿里巴巴-W:依托技术+生态+算力承接DS流量,发布QwQ-32B强化开源布局。DeepSeekR1的发布显著降低了大模型使用门槛,但其官

网因算力资源有限难以承载流量高峰,导致需求外溢。“模型易得、算力难求”矛盾迫使开发者转向拥有稳定算力支持的云厂商。阿里云

掌握自研芯片(如含光)、推理引擎优化及全球算力集群,可低成本承接高并发需求,凭借头部地位和基础设施优势成为DeepSeek流量

主要承接者。同时阿里进一步强化其Qwen系列的开源布局,发布并开源全新的推理模型通义千问QwQ-32B。R1和QwQ-32B推出有助于

进一步壮大阿里的开源模型生态,将短期流量转化为长期基础设施收益。且公司明确表示将积极投资于AI基础设施建设,未来三年集团在

云和AI的基础设施投入预计将超越过去十年的总和。我们认为当前阿里估值锚点短期转向

您可能关注的文档

文档评论(0)

anhuixingxing + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档