谷歌发布第七代TPU加速器“Ironwood”,单芯片峰值算力达4614TFLOPs

🤖 由 文心大模型 生成的文章摘要

谷歌在美国举行的“GoogleCloudNext25”大会上,正式推出了专为AI设计的第七代TPU(TensorProcessingUnit)加速器——“Ironwood”。这一全新芯片的单芯片峰值算力可达4,614TFLOPs,展现出谷歌在AI硬件领域的最新进展。​

据了解,Ironwood是谷歌首款在其张量核和矩阵数学单元中支持FP8计算的TPU。此前,谷歌TPU仅支持用于推理的INT8格式和用于训练的BF16格式。此外,Ironwood还显著增加了高频宽内存(HBM)容量,每颗芯片的HBM容量提升至192GB,是前一代Trillium的6倍,能够处理更大型的模型和数据集运算,减少数据传输需求。同时,其HBM带宽也大幅提升,单颗芯片的内存带宽可达7.2Tbps,为Trillium的4.5倍,确保了数据的快速存取。

谷歌云副总裁阿明・瓦赫达特表示:“Ironwood是我们迄今为止性能最强、功能最全、能效最高的TPU。它专为驱动具备思考能力的AI模型而设计,体现了AI基础设施的重大转变。”​

值得注意的是,去年I/O2024大会上,谷歌发布了第六代TPU“Trillium”,并于去年末向GoogleCloud客户开放使用。如今,Ironwood已计划在今年晚些时候向GoogleCloud客户开放。​

随着AI芯片市场竞争日益激烈,尽管英伟达目前占据行业领先地位,但亚马逊、微软等科技巨头也在积极布局自研解决方案。亚马逊推出AWSTrainium/Inferentia芯片以及Graviton处理器,微软则发布了Maia100和Cobalt100芯片。在这样的竞争态势下,谷歌凭借第七代TPUIronwood的发布,有望进一步巩固其在AI芯片领域的地位。​

「93913原创内容,转载请注明出处」