DeepSeek十大关键问题解读分享.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

DeepSeek十大关键问题解读

——人工智能系列深度

最近一年走势相关报告

《计算机行业点评报告:DeepSeek搅动了全球Al的“一池春水”(推荐)*

56%—计算机—沪深300计算机*刘熹》——2025-02-03

《美国对华Al限制加剧,自主可控大势所趋——Al算力“卖水人”系列(4)

40%

(推荐)*计算机*刘熹》——2025-01-24

24%《计算机行业事件点评:我国中部最大智算中心投产,国产算力景气上行(推

荐)*计算机*刘熹》——2025-01-14

9%

-7%

-23%

2024/02/192024/05/192024/08/192024/11/19

相对沪深300表现

表现1M3M12M

计算机30.1%3.3%57.5%

沪深3005.0%-4.1%16.5%

请务必阅读报告附注中的风险提示和免责声明2

核心提要

DeepSeek探索出一条“算法创新+有限算力”的新路径,开源Al时代或已至,国产Al估值或将重塑。

◆Q1:DeepSeek对于算力的影响?——Jevons悖论:短期训练侧算力需求或受影响,但DeepSeek推理价格下降吸引更多用户调用模型,带来英伟

达H100GPU的租赁价格提升,故表明算力需求量短期仍呈提升趋势,中长期推理算力需求有望持续增长。

◆Q2:文本与多模态对算力的需求差别?——多模态模型大规模应用,或将升级算力需求。Sora将大模型训练数据从大规模的文本/图像,发展到

视频数据,提升了新的维度,这或将数倍提升算力需求。

◆Q3:对芯片未来格局的影响?——训练:NV仍具备计算与生态护城河,DeepSeek带来模型训练算力使用效率提升,NV高等级芯片或主要用于

探索AGI;推理:推理化、国产化、ASIC化为三大趋势。

◆Q4:DeepSeek系列模型为何引起轰动?——技术与开源:DeepSeek优化模型结构(MLA+MOE、MTP)、模型训练方法(DualPipe)、针对性

GPU优化(FP8混合精度等)等内容,降低了训练成本,同时进行开源,各下游企业可以直接通过本地部署或云端调用,降低了调用成本。

◆Q5:模型未来侧重Dense还是Sparse(MOE)?—一个通才(Dense)能够处理多个不同的任务,但一群专家(MoE)能够更高效、更专业

地解决多个问题。

◆Q6:蒸馏模型的定义与发展潜力?——蒸馏可以减少原本大参数模型部署的硬件需求高、推理时间长、成本高昂的缺点,更有利于本地部署、

推理业务、应用与端侧发展。

◆Q7:多模态的演进路径?——AI大模型技术和应用逐渐从文本扩展至更多模态。

◆Q8:DeepSeek发生后对应用侧的影响?—DeepSeek在推动降本、强推理等驱动下,有望加速AI应用普及度迎来跨越式提升。

◆Q9:DeepSeek发布对于端侧的影响?

文档评论(0)

资料网上搜索整理 + 关注
实名认证
服务提供商

资料网上搜索整理,资料网上搜索整理,资料网上搜索整理。

1亿VIP精品文档

相关文档