计算机行业推理微服务NIM:英伟达的Thenextbigthing.docxVIP

计算机行业推理微服务NIM:英伟达的Thenextbigthing.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

目录

TOC\o1-2\h\z\u一、AI算力需求高涨,英伟达业绩持续高增 4

二、英伟达软硬件积累深厚,支持各类大模型开发 6

三、英伟达加速从硬件“卖铲人”转向企业服务 11

推理占比逐步提升,AI应用有望迎来爆发 11

英伟达推NVAIE和NIM微服务,加速AI在企业端部署 14

投资建议与投资标的 20

风险提示 20

图表目录

图1:Scalinglaw持续有效 4

图2:Gartner预测2023-2025年全球人工智能半导体收入(百万美元) 4

图3:海外头部云厂资本开支(十亿美元、Globalstandard) 5

图4:英伟达FY25Q1营收突破单季度新高 5

图5:英伟达FY25Q1净利润同比增长628% 5

图6:英伟达FY25Q1毛利率、净利率高于预期 5

图7:数据中心收入增长强劲,25Q1创历史新高(单位:十亿美元) 6

图8:FY25Q1,数据中心产品占业务收入87% 6

图9:英伟达AI芯片不断迭代 6

图10:MI300硬件性能指标 7

图11:CUDA发展历程 8

图12:CUDA软件栈 8

图13:CUDA赋能高 8

图14:CUDA旨在支持各种语言和应用程序编程接口 9

图15:英伟达数学库 10

图16:CUDA-X人工智能生态系统 10

图17:CUDA迭代历程 11

图18:23年AI领域融资大部分在模型和Infra侧 11

图19:2024以来AI应用公司融资增长快速 11

图20:AI应用随着成本降低的创新路径 13

图21:云计算市场分布和生成式AI市场分布情况 13

图22:移动互联网时代典型公司的股市表现 13

图23:NVAIE软件平台架构 14

图24:英伟达在Azure上推出AIFoundryService 15

图25:英伟达和戴尔AIFactory一起推广NVAIE 16

图26:英伟达NIM架构 16

图27:英伟达NIM支持大量的AI模型 17

图28:TensorRT-LLM能大幅提升推理性能 18

图29:通过NIM加速构建Agents 19

图30:NIM生态伙伴 19

表1:近期国产大模型价格统计 12

表2:英伟达NIM支持AI模型一览 17

表3:NIM部署和传统部署对比 18

一、AI算力需求高涨,英伟达业绩持续高增

模型能力取决于算力资源,计算基础设施有长期投资价值。尺度定律(Scalinglaws)通常表现为一些可测量的特征随着系统规模变化呈现出固定的比例关系。基于经验性的实验分析,OpenAI的研究者在2020年发现大语言模型也遵循着尺度定律,其性能受到模型大小、数据集大小以及计算浮点数的影响。其中,模型规模是影响性能最大的因素,而模型规模的训练则需要大量的算力资源。换而言之,算力供应才是模型能力突破的真正决定因素。这表明,大模型的持续迭代将会持续带来大量算力需求。

图1:Scalinglaw持续有效

数据来源:机械之心、全天候科技、每日经济新闻、绘制

近年来,生成式AI需求急剧攀升,推动AI芯片市场规模迅速扩大。市场调查机构Gartner最新报告显示,2024年全球AI芯片收入总额将达712.52亿美元,同比增长33%。Gartner还预测2025年全球AI芯片收入总额有望达到919.55亿美元,在今年的基础上再增长约29%。

图2:Gartner预测2023-2025年全球人工智能半导体收入(百万美元)

9195571252

91955

71252

53662

90000

80000

70000

60000

50000

40000

30000

20000

10000

0

2023E 2024E 2025E

数据来源:Gartner、通信世界网、

2023年初AIGC兴起至今,谷歌、微软等海外云厂商的CAPEX持续增长,且有望于2024年继续保持增长态势。微软预计下季度资本开支将环比大幅增长,谷歌预计2024年每季度资本支出将超过120亿美元,全年同比增长至少50%。亚马逊表示会有意义的增加资本开支,主要用于支持AWS基础设施和生成式AI的进一步研发建设。META上调2024资本开支预期到350-400亿

美元,用于建设数据中心以及支持AI业务。

有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档