商汤科技最新大语言模型推出后股价飙升逾30%

🤖 由 文心大模型 生成的文章摘要

中国人工智能(AI)巨头商汤科技在推出最新SenseNova大语言模型后,其股价周三上午飙升逾30%,该公司声称该模型与OpenAI GPT-4 Turbo模型性能相当。

周二,商汤科技联合创始人、董事长兼首席执行官徐立在上海举行的公司科技日活动上介绍了该公司最新SenseNova大语言模型的进展。

“在我们追求突破SenseNova能力极限的过程中,商汤科技仍然遵循Scaling Law的指导,我们基于知识、推理和执行三层架构构建了大型语言模型,通过增加参数数量来提高LLM学习和泛化能力,从而扩大LLM规模。”

徐立表示,SenseNova 5.0版本在2023年4月亮相,主要进步集中在知识、数学、推理和编码能力上。

商汤科技股价的上涨反映了投资者对中国LLM项目的持续热情,目前市场上有超过200个国产人工智能模型,致力于追赶OpenAI和谷歌等国外同行LLM。

根据商汤科技的声明,在相同的知识输入下,SenseNova 5.0可提供更好的理解、总结和问答,以支持教育和内容行业等垂直应用。最新LLM还被赞誉为具有“一流的数学、编码和推理能力,可为金融和数据分析应用提供坚实的基础”。

据商汤科技介绍,SenseNova 5.0还支持高清图像解析和理解,以及文本到图像的生成。此外,LLM最新迭代还支持跨文档提取复杂数据并能总结问题答案,具有“提供强大多模态交互能力”。

商汤科技称,最新LLM 经历了超过10 TB的令牌训练,涵盖了大量合成数据,这提高了其上下文窗口覆盖率——指的是AI模型在与用户对话期间可以处理的大量文本。

在上海活动上,徐立预测,随着市场上出现更多支持人工智能的个人电脑、智能手机和智能汽车,基于设备的LLM今年将出现指数级增长。

「93913原创内容,转载请注明出处」