算力专题研究二-从训练到推理-算力芯片需求的华丽转身.pdfVIP

算力专题研究二-从训练到推理-算力芯片需求的华丽转身.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

电子

究从训练到推理:算力芯片需求的华丽转身——算

力专题研究二

投资要点:

推理算力:算力芯片行业的第二重驱动力

我们在此前外发报告《如何测算文本大模型AI训练端算力需

求?》中,对未来三年AI训练卡需求持乐观态度。我们认为,推理侧

行算力对训练侧算力需求的承接不意味着训练需求的趋缓,而是为算力

业芯片行业贡献第二重驱动力。当前推理算力市场已然兴起,24年AI

专推理需求成为焦点。据Wind转引英伟达FY24Q4业绩会纪要,公司

题2024财年数据中心有40%的收入来自推理业务。如何量化推理算力需

报求?与训练算力相比,推理侧是否具备更大的发展潜力?我们整理出

告AI推理侧算力供给需求公式,并分类讨论公式中的核心参数变化趋势,

以此给出我们的判断。

ScalingLaws长文本趋势:推理需求的核心驱动力

根据OpenAI《ScalingLawsforNeuralLanguageModels》,并结合

我们对于推理算力的理解,我们拆解出云端AI推理算力需求≈2×模

型参数量×数据规模×峰值倍数。由ScalingLaws驱动的参数量爆发

是训练推理算力需求共同的影响因素;而对于推理需求,更为复杂的

是对数据规模的量化。我们将数据规模(tokens)拆解为一段时间内用

户对于大模型的访问量与单次访问产生的数据规模(tokens)的乘积,

其中,单次访问产生的数据规模(tokens)可以进一步拆解为单次提问

的问题与答案所包含的token数总和乘以单次访问提出的问题数。通过

华福证券

层层拆解,我们发现单次问答所包含的token数是模型中的重要影响因

素,其或多或少会受到大模型上下文窗口(ContextWindow)的限制。

而随着上下文窗口瓶颈的快速突破,长文本趋势成为主流,有望驱动

推理算力需求再上新台阶。

结论:

我们首先根据前述逻辑测算得到AI大模型推理所需要的计算量,

随后通过单GPU算力供给能力、算力利用率等数值的假设,逐步倒推

得到GPU需求数量。若以英伟达当代前代GPU卡供给各占50%计

券算,我们认为2024-2026年OpenAI云端AI推理GPU合计需求量为

研148/559/1341万张。

报建议关注

告-算力芯片:寒武纪海光信息龙芯中科

-服务器产业链:工业富联沪电股份深南电路胜宏科技

风险提示

AI需求不及预期风险、ScalingLaw失效风险、长文本趋势发展

不及预期风险、GPU技术升级不及预期的风险、测算模型假设存在偏

差风险。

诚信专业发现价值1

正文目录

1如何测算文本大模型AI推理端算力需求?3

2ScalingLaws长文本趋势:推理需求的核心驱动力4

2.1关于模型参数量:ScalingLaws仍为核心4

2

您可能关注的文档

文档评论(0)

Seeker研报 + 关注
实名认证
文档贡献者

如果有被下架的,可以私我发你,欢迎垂询各种研究报告!也可以咨询定制获取特定主题报告,欢迎光临!

1亿VIP精品文档

相关文档