IBM公布了光学技术的突破性研究,该研究可极大改善数据中心训练和运行生成式AI模型的方式。研究人员开创了一种共封装光学器件(CPO)新工艺,这是下一代光学技术,可通过光学器件以光速实现数据中心内的连接,以补充现有的短距离电线。通过设计和组装第一个公开宣布成功的聚合物光波导(PWG)来为该技术提供动力,IBM研究人员展示了CPO将如何重新定义计算行业在芯片、电路板和服务器之间传输高带宽数据的方式。
如今,光纤技术可高速传输长距离数据,几乎用光而不是电来管理世界上所有的商业和通信流量。尽管数据中心使用光纤作为外部通信网络,但数据中心的机架仍然主要通过铜质电线进行通信。这些电线连接GPU加速器,而这些加速器可能有一半以上的时间处于闲置状态,等待来自大型分布式训练过程中其他设备的数据,这可能会产生大量的费用和能源。
IBM研究人员展示了一种将光学速度和容量引入数据中心的方法。在一篇技术论文中,IBM 介绍了一种可以实现高速光学连接的新型CPO原型模块,该技术可以显著增加数据中心通信的带宽,最大限度减少GPU停机时间,同时大幅加速AI处理。如上所述,这项研究创新将实现:
与中档电气互连相比,通过将能耗降低5倍以上,降低扩展生成式人工智能的成本,同时将数据中心互连电缆的长度从一米延长到数百米。
更快的AI模型训练,使开发者能使用CPO训练大型语言模型,速度比传统电线快五倍。CPO 可以将训练标准LLM所需的时间从三个月缩短到三周,并且通过使用更大的模型和更多的 GPU,性能会进一步提升。
大幅提高数据中心的能源效率,每个经过训练的AI模型可节省相当于5000个美国家庭一年的电力消耗。
IBM高级副总裁兼研究总监Dario Gil表示:“由于生成式人工智能需要更多的能源和处理能力,数据中心必须不断发展,而同封装光学器件可以让这些数据中心面向未来。凭借这一突破,未来的芯片将像光纤电缆将数据传入和传出数据中心一样进行通信,从而开启一个更快、更可持续的通信新时代,可以处理未来的人工智能工作负载。”