网站大量收购独家精品文档,联系QQ:2885784924

AI产业川流汇聚,云端两旺机遇开启.pdfVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

目录

GB系列:AI产业川流汇聚,云端两旺机遇开启4

Blackwell众多技术突破,整体以机柜形式交货4

Blackwell或成理市场的钥匙,FP4精度潜力较大6

风险因素9

表目录

表1:建议关注9

图目录

图1:GB200NVL72机柜正面4

图2:GB200NVL72机柜背面4

图3:GB200机柜4

图4:GB200机柜背面4

图5:GB200Superchip5

图6:Blackwell的技术突破5

图7:全球服务器出货按价格带分布(万台)6

图8:四种数据精度6

图9:英伟达H100相对A100有较大峰值性能提升(TFLOPS)6

图10:训练:在不同规模的GPT模型上使用BF16与FP8进行训练的loss7

图11:推理:使用Tensor-LLM实现FP8推理的性能7

图12:FP8推理过程7

图13:英伟达产品算力对比8

图14:FP16和FP4精度下生成的图片对比9

请阅读最后一页免责声明及信息披露3

GB系列:AI产业川流汇聚,云端两旺机遇开启

Blackwell众多技术突破,整体以机柜形式交货

GB200机柜有NVL36和NVL72两种规格。GB200NVL36配置中,一个机架有36个

GPU和9个双GB200计算节点(以托盘为单位)。GB200NVL72在一个机架中配置了

72个GPU/18个双GB200计算节点,或在两个机架中配置了72个GPU,每个机架

上配置了18个单GB200计算节点。

图1:GB200NVL72机柜正面图2:GB200NVL72机柜背面

资料来源:英伟达官网,信达证券研发中心资料来源:英伟达官网,信达证券研发中心

⚫计算托盘:每一个计算托盘有两个NVIDIAGB200GraceBlackwell超级芯片。每个

超级芯片将两个高性能NVIDIABlackwellTensorCoreGPU和NVIDIAGraceCPU

与NVLink芯片到芯片(C2C)接口连接起来,可提供900GB/s的双向带宽。借

助NVLink-C2C,应用程序可以一致地访问统一的内存空间。这简化了编程,并支持万

亿参数LLM、用于多模态任务的transformer模型、用于大规模仿真的模型以及用于

3D数据的生成模型的更大内存需求。

⚫交换托盘:NVIDIAGB200NVL72引入了第五代NVLink,它可以在单个NVLink域

中连接多达576个GPU,总带宽超过1PB/s,快速内存为240TB。每个

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档