科大讯飞表示,其LLM完全在华为平台上进行训练

🤖 由 文心大模型 生成的文章摘要

科大讯飞表示,其拥有唯一完全在自主研发的计算平台上训练的大型语言模型(LLM),该平台与华为共同开发,这标志着人工智能行业在面临美国限制的情况下在追求自给自足方面又迈出了一步。

科大讯飞董事长刘庆峰表示,尽管中国大部分LLM都以包含美国组件的计算平台为基础,例如英伟达的图形处理单元(GPU),但在美国政府已基本切断中国获取最先进芯片和人工智能技术的渠道之际,科大讯飞决心在“自主开发、可控”的基础设施上训练LLM。

刘庆峰在科大讯飞发布其升级版星火模型的仪式上表示:“我们能走多远,取决于我们是否拥有自主开发的、可控的基础能力来支撑(人工智能发展)。”

刘庆峰在主题演讲中指出,美国对LLM开发技术的限制,凸显了中国开发自主人工智能训练计算基础设施的必要性。美国的制裁限制了某些技术向中国的出口,最明显的是近年来推动人工智能热潮的英伟达GPU。

刘庆峰表示,该公司星火模型是在“飞星一号”计算平台上进行训练的,该平台基于华为Ascend计算解决方案。

如今华为Ascend AI芯片在中国市场迅速流行,江苏鲲鹏升腾生态创新中心首席运营官王涛本月在南京世界半导体大会期间表示,在一些测试中,Ascend 910B芯片的性能在训练LLM时可达到NVIDIA A100的80%至120%。

分析人士表示,昇腾解决方案是中国迄今为止在开发本土人工智能基础设施方面取得的最佳成果。随着国有企业订购昇腾支持的项目,这些企业也获得了越来越多的支持。

然而,华为硬件仍然缺乏NVIDIA Cuda平台那样活跃的开发者社区,“如果不能解决这个问题,华为赶上英伟达的机会就很小。”

在星火4发布会上,刘庆峰表示,新模型的功能可以与GPT-4 Turbo相媲美,GPT-4 Turbo是Open AI八个多月前推出的最先进模型之一。

据介绍,星火4已经在医疗等多个业务场景中得到实际应用,帮助医生和患者进行诊断和治疗。

「93913原创内容,转载请注明出处」