计算机芯片推动了人工智能的显著进步,AlphaChip则利用人工智能来加速和优化芯片设计。这种方法已被用于设计谷歌定制AI加速器张量处理单元(TPU)的芯片布局。
AlphaChip是首批用于解决实际工程问题的强化学习方法之一。可在数小时内生成“超人”或同类芯片布局,而无需耗费数周或数月的人力,其布局已应用于全球各地的芯片,从数据中心到手机。
设计芯片布局并非易事。计算机芯片由许多相互连接的块组成,这些块具有多层电路元件,所有元件都通过极细的导线连接。此外,还有很多复杂且相互交织的设计约束,必须同时满足所有约束。由于其复杂性,芯片设计师们在60多年来一直在努力实现芯片布局规划过程的自动化。
与学习掌握围棋、国际象棋和将棋游戏的AlphaGo和AlphaZero类似,我们构建了AlphaChip,将芯片布局规划视为一种游戏。
AlphaChip从空白网格开始,一次放置一个电路元件,直到完成所有元件的放置。然后根据最终布局的质量获得奖励。一种新颖的“基于边缘”图形神经网络使AlphaChip能够学习互连芯片元件之间的关系,并在整个芯片中进行推广,让AlphaChip在设计每个布局时都能不断改进。
AlphaChip自2020年发布以来,已经生成了谷歌每一代TPU所使用的“超人芯片”布局。这些芯片使得大规模扩展基于谷歌Transformer架构的AI模型成为可能。
TPU是强大的生成式AI系统的核心,从大型语言模型(如Gemini)到图像和视频生成器Imagen和Veo。这些AI加速器也是Google AI服务的核心,可通过Google Cloud供外部用户使用。
为了设计TPU布局,AlphaChip首先在前几代的各种芯片块上进行练习,例如片上和芯片间网络块、内存控制器和数据传输缓冲区。这个过程称为预训练。然后我们在当前的TPU块上运行AlphaChip以生成高质量的布局。与之前的方法不同,AlphaChip解决了更多芯片布局任务实例,因此变得更好、更快,就像人类专家所做的那样。
随着每一代新TPU(包括最新Trillium)的推出,AlphaChip 设计了更好的芯片布局并提供了更多的整体平面图,从而加快了设计周期并产生了性能更高的芯片。
AlphaChip的影响可以从其在Alphabet、研究界和芯片设计行业的应用中看出。除了设计TPU 等专用AI加速器外,AlphaChip还为Alphabet的其他芯片生成布局,例如Google Axion处理器,这是我们首款基于Arm的通用数据中心CPU。
外部组织也在采用和开发AlphaChip。例如,全球顶级芯片设计公司之一联发科扩展了 AlphaChip,以加速其最先进芯片(如三星手机使用的Dimensity Flagship 5G)的开发,同时提高了功耗、性能和芯片面积。
AlphaChip引发了芯片设计人工智能研究的爆炸式增长,并扩展到芯片设计的其他关键阶段,例如逻辑综合和宏选择。