谷歌八代TPU解读20260422.pdfVIP

谷歌八代TPU解读20260422.pdf

1、核心事件概述

2026年4月，谷歌云在其年度开发者大会上发布了两款第八代自研TPU芯片：TPU8T和

TPU8I。8T专为AI模型训练设计，8I则专门针对推理场景优化。这是谷歌首次将训练和推

理芯片分开设计，标志着其AI硬件战略的重要转变。同时，谷歌还发布了企业级AI智能

体平台，旨在从算力和应用两个层面，挑战当前由英伟达和OpenAI主导的市场格局。

2、两款TPU的核心设计与竞争力

TPU8T：为大规模训练优化

这款芯片的核心竞争力不在于单颗芯片的峰值算力，而在于其构建超大规模集群的能力。

一个TPU8T超级荚可以扩展到9600颗芯片，提供极高的整体计算吞吐量和约2PB的共享

高带宽内存。它重点解决了训练任务中的几个关键瓶颈：高效处理稀疏数据、减少数据在

存储和计算单元间的搬运开销、以及优化大规模芯片集群间的网络通信。谷歌宣称，相比

前一代产品，8T在训练场景下的“每美元性能”最高可提升2.7倍。

TPU8I：为高并发推理重塑架构

TPU8I是本次更具战略意义的产品。它并非训练芯片的简化版，而是针对推理任务完全重

新设计。其最显著的特点是资源配置：虽然其峰值算力低于8T，但配备了更大的片上

SRAM缓存（384MB，是8T的3倍）、更高的HBM内存容量（288GB）和带宽。同时，它

更多 >