- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
正文目录
十年磨一剑,TPU引领AI芯片时代 3
TPU如何发展而来? 3
TPU优势何在? 4
芯片层面:能效王者,架构设计之美淋漓尽致 4
集群层面:算力利用率是最好的证明 8
谷歌视角:如何理解TPU的生态位? 10
TPU商业模式何解? 11
为什么谷歌TPU能够成功? 11
国产TPU厂商中昊芯英崭露头角 12
风险提示 14
图表目录
图表1:谷歌TPU发展史 3
图表2:主流AI芯片架构及主要厂商 4
图表3:TPU和GPGPU对比图 4
图表4:通用处理器CPU和GPU的逻辑架构 5
图表5:张量的图形化表达 6
图表6:脉动阵列模型与一个乘累加单元 6
图表7:浮点精度的特点与应用场景 7
图表8:部分人工智能芯片支持的数值格式 8
图表9:算力利用率 8
图表10:TPUv4和A100在各种模型上的训练效果 9
图表11:TPUv4和A100在训练上的成本比较 9
图表12:谷歌自研光学芯片Palomar的性能 9
图表13:全球数据中心加速器年出货量 10
图表14:AFM模型和其他模型性能对比 11
图表15:顶尖公司对TPU或类TPU的探索 12
图表16:产品性能比对图 12
图表17:中昊芯英营收(单位:亿元) 13
图表18:各省算力规划 14
十年磨一剑,TPU引领AI芯片时代
TPU如何发展而来?
简而言之,为更专用的AI计算而来。2013年,GoogleAI负责人发现,如果有1亿安卓用户每天使用手机语音转文字服务3分钟,消耗的算力就已是谷歌所有数据中心总算力的两倍。而传统的通用CPU以及专攻图形加速、视频渲染等复杂任务GPU无法满足深度学习工作负载的巨大需求,同时存在效率较低、专用运算有限等问题。于是,为探索出更具成本效益、节能的机器学习解决方案,谷歌毅然决定自行研发机器学习专用的处理器芯片,并于2015年宣布第一代TPU芯片(TPUv1)在内部上线,随后开启了长达10年的TPU更新迭代。
图表1:谷歌TPU发展史
来源:Google,
作为一种AI芯片,TPU是专用集成电路(ASIC)的代表。主流AI芯片架构包括GPGPU、ASIC和FPGA。GPGPU通用性强,生态完善,GPGPU的主要供应商英伟达是AI市场的绝对龙头,但GPGPU存在着成本高等问题;ASIC虽然算力强大,功耗小,但相较于GPGPU在通用计算上稍有欠缺;FPGA更具灵活性,也具有足够的算力,但相对开发周期长,复杂算法开发难度大,成本昂贵。TPU专为单一特定目的而设计:用以运行构建AI模型所需的独特矩阵和基于矢量的数学运算。其架构专为矩阵乘法而设计,这使它们能够处理大量数据以及复杂的神经网络。需要说明的是,我们也看到相关研究将TPU归类为DSA(专用领域架构处理器),因为ASIC是加速某一项功能,而DSA是加速某一类功能。但总体上ASIC和DSA的特征较为相仿,本文不作进一步区分。
图表2:主流AI芯片架构及主要厂商
来源:中兴文档,凡亿企业培训,半导体产业纵横,满天芯,元宇宙投融邦,半导体行业观察,中昊芯英科技,芯榜,与非网eefocus,
TPU优势何在?
芯片层面:能效王者,架构设计之美淋漓尽致
六代版本更新,与GPGPU平分秋色。我们将历代TPU以及同时代的GPGPU进行梳理。首先,我们观察到同代TPU与GPGPU大多数处于同代或相近制程。第四代TPU已采用7nm制程,据TheNextPlatform推测第五代/第六代TPU分别采用5nm/4nm制程,而英伟达Ampere/Hopper/Blackwell架构分别采用7nm/4nm/4nm制程。在算力上,谷歌目前暂时落后一代。2024年谷歌发布第六代TPUTrillium,实现最大算力926TFLOPS(BF16)/1852TFLOPS(INT8),相较于第五代TPUv5e和v5p实现了飞跃式上升,比肩英伟达2023年发布的H100,对应算力为989TFLOPS(FP16)
/1978TFLOPS(INT8orFP8)。但在性能功耗比上,我们认为谷歌优势显著。谷歌并未披露最新产品的功耗指标,我们从前代产品可以窥见一二——2021年发布的第四代TPUv4性能功耗比为0.89-1.31TOPS/W,而英伟达同代产品A100(2020年
您可能关注的文档
- 当前经济与政策思考:观察企稳回升的斜率.docx
- 道氏技术战略资源业务高增中,锂电业务有望迎拐点.docx
- 德固特深度研究报告:“固”本培元,“炭”索新机.docx
- 地产增量政策频出;巴斯夫延迟复产或开启维生素新一轮上涨.docx
- 地平线将于港交所上市,车型定点累计超270个.docx
- 电力设备行业大选后的美国仍是新能源出海优质市场.docx
- 洲海风建设加速,国内企业扬帆起航.docx
- 电力行业8月月报:分布式光伏新政出台,火电出力同比由负转正.docx
- 电气设备行业光伏花语第32期:如何展望光伏行业的供给侧政策?.docx
- 电投产融“能源与金融”双主业,拟进行资产重组打造A股第三家核电运营公司.docx
- 电子行业开放计算峰会OCP2024跟踪报告:聚焦AI和数据中心,全球领军厂商展示最新AI产品方案.docx
- 东北固收转债专题:数据要素转债梳理.docx
- 东方雨虹深度研究:需求回稳,零售破局,重拾信心.docx
- 东鹏饮料百亿后乘势进击,平台化公司雏形已现.docx
- 房地产行业财政发力对地产有哪些影响?.docx
- 房地产行业光大地产房地产类公募REITs月报(2024年9月):C-REITs短期成交遇冷,不改长期投资价值.docx
- 房地产行业流动性跟踪报告(2024年三季度):24年Q3房地产需求侧融资环比回升,房企债券净融资边际改善.docx
- 房地产行业样本城市周度高频数据全追踪:新房和二手房成交边际改善,成交量信心指数边际回落.docx
- 房地产行业月度分析报告:9月末活跃指数翘尾,房企打响“保价”第一枪.docx
- 房地产政策“组合拳”发布,房地产市场有望逐步筑底.docx
最近下载
- 感恩父母老师同学主题班会PPT课件.pptx VIP
- FLUKE Calibration福禄克计量校准8808A Digital Multimeter 8808A Users (Fre) (2.04 MB(兆))说明书用户手册.pdf
- 中国工商银行国际化发展:历程、挑战与战略转型.docx
- 起重吊装事故应急处置措施.docx VIP
- 统编2024版七年级上册道德与法治第八课生命可贵8.1《认识生命》教学设计.docx VIP
- 2024-2025学年初中信息技术(信息科技)川教版(2024)七年级上册教学设计合集.docx
- 春节开展困难企业和困难人员慰问活动方案.pptx VIP
- 湘教版科学小学四年级上册期中检测试题(含答案).doc VIP
- 升平煤矿安全生产事故综合应急救援预按及流程图.doc VIP
- 2026浙江交通集团校园招聘(919人)笔试模拟试题及答案解析.docx VIP
原创力文档


文档评论(0)