🤖 由 文心大模型 生成的文章摘要
中国电信表示,已经开发出两种完全使用国产芯片训练的大型语言模型(LLM),这表明国内在人工智能领域实现芯片自主方面取得了进展。
中国电信人工智能研究所(Institute of AI)表示,其开源TeleChat2-115B和第二个未具名模型在数万块国产芯片上进行了训练。
Institute of AI表示,这一成就“表明中国已经真正实现了国内LLM培训的完全自给自足”,标志着LLM创新和自力更生的新阶段开始。
中国电信表示,这个未命名的模型有1万亿个参数。人工智能模型的复杂性和有效性在很大程度上取决于训练过程中涉及的参数的规模。中国电信表示,TeleChat2t-115B有超过1000亿个参数。
据两名知情人士透露,华为已向中国大型服务器公司提供了Ascend 910C处理器的样品,供其进行硬件测试和配置。据华为人工智能芯片经销商之一的消息来源称,该芯片也被提供给英伟达的主要客户中国互联网巨头。
华为Ascend芯片和人工智能培训解决方案是本土人工智能公司首选的英伟达替代品之一。根据中国电信国家云服务提供的服务器定价计划,除了华为芯片,中国电信还提供由中国初创企业寒武纪开发的芯片。
此次合作预计将减少中国对英伟达图形处理单元(GPU)等国外芯片的依赖,这些芯片被认为是训练人工智能模型的首选。
「93913原创内容,转载请注明出处」