网站大量收购闲置独家精品文档,联系QQ:2885784924

英伟达新一代芯片_Blackwell翻车过程全纪录.pdf

英伟达新一代芯片_Blackwell翻车过程全纪录.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

英伟达新一代芯片Blackwell翻车过程全纪录

蓉和半导体CEO吴梓豪

上周英伟达Blackwell芯片问题消息满天飞,一开始是CoWoS良率太低,B100被取消,

然后是Blackwell出货延迟,最后是8月2号Blackwell芯片retapeout被广泛讨论,

然而实际情况到底是怎一回事?

7月中台积电内部已经发现Blackwell问题,但因为连续多天肆虐小岛的格美台风,导致

小岛经历5天的台风假,7月29号一上班,台积电内部正式开会讨论此事,Blackwell芯

片retapeout在外资与台系卖方的报告后,全世界科技行业炸锅,作者从台积电内部

了解,也确认了重新流片真有其事.

同时间还有报告称因CoWoS-L良率不好,影响了NV几款Blackwell芯片的生产,新

的芯片型号B200A被提出来,B100被取消,GB200等型号出货延迟等等消息.

由于太多讯息满天飞,市场上大大小小卖方的讯息取得与理解都不同,整个市场的解读

众说纷纭,大家用自己的认知去理解与求证,有朋友问我这是台积电的问题还是NV?到

底问题出在哪?

事实上,上述几个问题是同时存在的,但问题的核心还是出在Blackwell设计缺陷需要re

tapeout,而CoWoS-L良率不好这也是同时存在,在这些问题上,各种型号,名称的混

乱加剧了分析问题的复杂性,导致许多卖放解读错误,我甚至看到了有专家说CoWoS-

L良率只有66%,只能出10颗Gooddie的离谱说法,在这我还是得说明一下CoWoS-

L良率确实有问题,但后段封装良率80%都不可能去排产更何况66%这种水平,实际上

CoWoS-L目前的良率在90%出头,持续提升中,90出头的良率当然是不好,因为

CoWoS-S的良率是99%以上.

不论B100/200或GB200的延误主要在Blackwell原始芯片也就是B100的retapeout,

因为更高型号的B200或GB200都是来自B100的Chiplet方案,实际上在台积电内部

Blackwell只有两个型号那就是b100以及b102.

由于Blackwell采取Chiplet+CoWoS组成与型号比较复杂,再加上NV对Blackwell

定义模糊不清,又有分析机构传出B100取消等消息,这里面出现了一些名字理解上的混

乱.

我想应该统一各型号的命名才不会有理解的错误,b102是所有Blackwell芯片的基础,

由一个GPUdie+4个HBM3e组成,b100则是由两个b102组成,两个GPUdie+8

个HBM3e,如下图所示

对应服务器的出货,b102则是B200A,而b100则是B200,GB200则是两颗b100+一

颗GraceCPU放在一块主版上,GB200并不是一颗芯片而是一块版,不应该与芯片来同

比较,如下图所示

目前针对Blackwell架构的基础芯片只有两款b102与b100,但对应服务器的话则有三款

主板(B200A/B200/GB200),很多人好奇,这时候B100跑哪去了?说实在的NV定义本

身就不清楚,而针对不同应用的服务器则可组合出更多款式(HGXB200A/HGXB200/

NVL36/72甚至是NVL8或GB210A的气冷版本)

看了许多卖方报告,除了一小部分出现离谱的错误以外,比如缺乏行业常识的CoWoS-L

良率,目前整个市场各式各样的解读,除了Blackwell同时出现多个问题以外,还有一

个很重要的因素就是命名的混乱,每个人理解认知不同,统一一下说法很有必要,大家

更不要针对所谓名字去做无谓的争执,以免乱上加乱,大摩8/2的报告也注意到了这一

点,另外也看到了一个现象,那就是外资卖方研究以芯片源头为依据,内资卖方往往缺

少芯片端的基础讯息,而以服务器整体分析为着重点.

理清楚了芯片生产端也就是台积电针对Blackwell只有两个型号也就是b102/b100,那我

们就可以清楚前面说的retapeout就是那颗基础的b102芯片,大摩8/2号的报告称这

个问题会导致两

您可能关注的文档

文档评论(0)

偷得浮生半日闲 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档