DeepSeek或提前推出最新AI模型R2

🤖 由 文心大模型 生成的文章摘要

上个月,Deepseek凭借其价格亲民的人工智能推理模型,引发了全球股市超1万亿美元的抛售浪潮,其表现远超众多西方竞争对手。

据三位知情人士透露,目前,这家总部位于杭州的公司正紧锣密鼓地推进R1型号后续模型的上市工作。其中两位知情人士称,Deepseek原本计划于5月初发布R2,但如今期望提前发布,不过并未透露具体细节。

该公司表示,期望新模型在编码方面有更出色的表现,并且能够实现除英语之外其他语言的推理。此前,R2发布时间表加速这一细节从未被披露过。

Deepseek竞争对手仍在努力应对R1带来的冲击。R1采用了性能相对较弱的英伟达芯片打造,然而,与美国科技巨头耗费数千亿美元研发的芯片相比,依然具备相当的竞争力。

印度科技服务提供商Zensar首席运营官Vijayasimha Alilughatta表示:“DeepSeek发布R2模型极有可能成为人工智能行业的一个关键转折点。” 他还指出,DeepSeek在打造高性价比人工智能模型方面取得的成功,“或许会促使全球各地的公司加快自身研发步伐……打破该领域少数主导者的垄断局面” 。

Deepseek R2的推出很可能引起美国政府的关注,毕竟美国政府已将在人工智能领域的领先地位列为国家重点发展方向。而R2的发布则可能进一步激发中国政府和企业的积极性,目前已有数十家中国企业表示,已着手将DeepSeek模型整合到自身产品当中。

三位知情人士称,DeepSeek凭借低成本AI模型获得成功,这得益于High-Flyer在过去十年里对研究和算力的巨额投入。

这家量化基金是人工智能交易领域的早期开拓者。2020年,一位高管曾表示,High-Flyer将 “全力进军”人工智能领域,把70%的收入重新投入到人工智能研究中。2020年和2021年,High-Flyer投入12亿元人民币,建成了两个超级计算AI集群。第二个集群Fire-Flyer II由约10000个英伟达A100芯片组成,专门用于训练AI模型。

「93913原创内容,转载请注明出处」