电子行业深度报告:GB200引领算力提升,玻璃基板成为芯片封装竞争新热点.docxVIP

电子行业深度报告:GB200引领算力提升,玻璃基板成为芯片封装竞争新热点.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

东吴证券研究所

东吴证券研究所

图表目录

图1:GB200产品效果图 5

图2:GB200NVL72产品效果图 5

图3:封装技术发展历程 7

图4:玻璃基板结构图 8

图5:玻璃基板系统级封装原型 8

图6:玻璃基板可容纳多50%的小芯片 8

图7:面板玻璃 9

图8:有机材料基板与玻璃基板性能对比 9

图9:玻璃基板性能优势 10

图10:英特尔积极布局玻璃基板封装行业 11

表1:英伟达产品性能对比 4

表2:国内玻璃基板前沿厂商介绍 11

2/13

GB200深度创新,引领GPU全面升级

当地时间3月18日凌晨,英伟达创始人兼CEO黄仁勋在美国加州圣何塞召开了GTC2024大会,会上正式发布了面向人工智能模型的全新Blackwell架构,以及基于此架构的超级芯片——GB200。该项目正处于积极进行设计调整和测试阶段。

基于Blackwell全新架构,GB200不断扩展算力边界

Blackwell的全新架构使得芯片算力得到跨越式提升。Blackwell是英伟达首个采用多芯片封装设计的GPU,在同一个芯片上集成了两个GPU,代表了生成式AI和加速运

算领域的重大突破。Blackwell架构的GPU,AI性能可以达到20petaflops,而英伟达两年前发布的“H100”的算力为4petaflops,使得在运行具有数万亿参数的实时生成式AI大型语言模型时,其成本和能耗实现了大幅降低。Blackwell并不是芯片的名称,而是作为整个平台的名字,采用Blackwell架构的GPU被划分为了B200和GB200两个产品系列。在Blackwell架构下,B200的晶体管数量是H100的两倍以上,达到2080亿个。基

于台积电的N4P制程工艺,B200由两个Di(eInterface(NV-HBI)连接,带宽达到10TB/s。

裸片)组合而成,通过NvidiaHighBandwidth

东吴证券研究所

东吴证券研究所

GB200则是基于B200的进一步发展,提供了前所未有的推理性能与效率。GB200通过900GB/s超低功耗的片间互联,将两个B200GPU与一个GraceArmCPU相连,

训练与推理LLM的性能比上代实现了大幅提升。英伟达首席执行官表示,基于Blackwell的架构,GB200在性能上具有巨大的升级。此前的H100的AI性能为每秒4千万亿次浮点运算,而GB200则为每秒20千万亿次浮点运算,是H100的五倍。在参数为1750亿的GPT-3LLM基准测试中,英伟达称GB200的训练性能和训练速度均大幅领先H100。此外,GB200在能耗成本上也带来显著降低。在1.8万亿参数的MoE架构GPT模型训练中,GB200实现相同目标所消耗的能源也远低于HopperGPU。GB200的推出,标志着高性能计算领域的新时代正式开启,它不仅能够处理前所未有的复杂数据集,还能以更高的能效运行大型AI模型。

3/13

表1:英伟达产品性能对比

Platform GB200 B200 B100

HGXB200

HGXB100

1xGraceCPUGPU

1xGraceCPU

GPU

GPU

GPU

GPU

FP4Tensor

20/40

9/18

7/14

72/144

56/112

Dense/Sparse

petaflops

petaflops

petaflops

petaflops

petaflops

FP6/FP8Tensor

10/20

4.5/9

3.5/7

36/72

28/56

Dense/Sparse

petaflops

petaflops

petaflops

petaflops

petaflops

INT8Tensor

10/20

4.5/9

3.5/7

36/72

28/56

Dense/Sparse

petaflops

petaflops

petaflops

petaflops

petaflops

FP16/BF16Tensor

5/10

2.25/4.5

1.8/3.5

18/36

14/28

Dense/Sparse

petaflops

petaflops

petaflops

petaflops

petaflops

TF32Tensor

2.5/5

1.12/2.25

0.9/1.8

9/18

7/14

Dense/Sparse

petaflops

petaflops

petaflops

petaflops

petaflops

FP64

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档