腾讯无需英伟达最先进芯片即可提高AI训练效率

🤖 由 文心大模型 生成的文章摘要

在技术自力更生背景下,中国科技巨头正在寻求基于现有系统和设备来提升大型语言模型 (LLM)训练的方法,腾讯已升级其高性能计算(HPC)网络,提升其人工智能(AI)能力。

腾讯云计算部门周一表示,腾讯智能高性能网络(中文名为星脉)2.0 版本将使网络通信和LLM培训的效率分别提高60%和20%。

由于美国出口规则严格,英伟达先进芯片供应受限,而腾讯星脉此次性能提升正是在此背景下实现的。腾讯通过优化现有设施实现了性能提升,而不是试图在支出和尖端半导体方面与 OpenAI等美国竞争对手正面竞争。

HPC网络连接强大的图形处理单元(GPU)集群,以极高的速度处理数据和解决问题。

腾讯称,在现有HPC网络技术下,计算集群花费了太多时间与其他集群进行通信,导致相当一部分GPU容量处于闲置状态。因此,公司升级了网络,以加快通信过程并降低成本。

腾讯介绍,腾讯星脉网络可以支持拥有超过100000个GPU的单个计算集群,规模是2023年发布的网络初始版本的两倍。腾讯表示,性能的提升将识别问题所需的时间从之前的几天缩短到几分钟。

腾讯最近大力加强其在快速发展的人工智能领域的技术,致力于推广其内部LLM以供企业使用,并且还提供帮助其他公司建立自己模型的服务。

生成式人工智能服务的迅速普及导致中国人工智能行业陷入价格战,由于企业寻求技术更大程度的商业化,所有主要参与者均大幅削减其产品价格。

今年5月,腾讯免费提供浑元LLM精简版,同时降低标准版价格。此前,包括字节跳动、百度和阿里巴巴在内的竞争对手也采取了类似举措。

模型训练是一个能源密集型且昂贵的过程,竞相提高其效率对于价格战至关重要,因为这样可以让运营商及其客户更能负担得起这项技术。

百度创始人兼首席执行官李彦宏今年4月表示,其旗舰项目Ernie LLM的训练效率在一年内提高了5倍多。他说,该模型的推理性能提高了105倍,推理成本降低了99%。

此外,OpenAI还将近期效率的提高视为其5月推出的GPT-4o模型定价大幅降低的原因。

「93913原创内容,转载请注明出处」