IBM和AMD宣布合作在IBM Cloud上部署AMD Instinct MI300X加速器作为服务。该产品预计将于2025年上半年上市,旨在提高Gen AI模型(例如企业客户的高性能计算应用程序)的性能和能效。此次合作还将使IBM watsonx AI和数据平台支持AMD Instinct MI300X加速器,以及Red Hat® Enterprise Linux® AI推理。
AMD执行副总裁兼首席商务官Philip Guido表示:“随着企业采用更大的AI模型和数据集,系统内的加速器必须能够以高性能和可扩展性处理计算密集型工作负载,这一点至关重要。AMD Instinct加速器与AMD ROCm软件相兼容,对包括IBM watsonx AI、Red Hat Enterprise Linux AI和Red Hat OpenShift AI在内平台提供了广泛的支持,以使用这些强大的开放生态系统工具构建领先的框架。我们与IBM Cloud 的合作旨在让客户能执行和扩展Gen AI推理,而不会影响成本、性能或效率。”
IBM Cloud总经理Alan Peacock表示:“AMD和IBM Cloud有着共同的愿景,那就是将AI引入企业。我们致力于将AI的力量带给企业客户,帮助企业确定结果的优先次序,并确保企业在部署AI时拥有选择权。基于IBM Cloud AMD加速器将为我们的企业客户提供另一种扩展选项,以满足企业AI需求,同时还旨在帮助优化成本和性能。”
此外,IBM和AMD还合作在IBM Cloud上提供MI300X加速器服务,以支持采用AI的企业客户。为了帮助各行各业的企业客户,IBM和AMD打算基于IBM Cloud的安全性和合规性功能。
对于生成式AI推理工作负载,IBM计划在IBM watsonx AI和数据平台中启用对AMD Instinct MI300X加速器的支持,为watsonx客户提供额外的AI基础架构资源,以便在混合云环境中扩展AI工作负载。此外,Red Hat Enterprise Linux AI和Red Hat OpenShift AI平台可使用 MI300X加速器上的InstructLab运行带有对齐工具的Granite系列大型语言模型。