🤖 由 文心大模型 生成的文章摘要
大型语言模型DeepSeek-R1令广大开发者兴奋不已,其被认为是OpenAI o1等“推理”模型的经济实惠且开放的竞争对手。
该模型一步一步生成响应,其过程类似于人类的推理。这使得比早期的语言模型更善于解决科学问题,并可能在研究中发挥作用。1月20 日发布的R1的初步测试表明,它在化学、数学和编码的某些任务上的表现与o1相当。
英国人工智能咨询公司DAIR.AI 联合创始人兼人工智能研究员Elvis Saravia表示:“这太出乎意料了。”
R1脱颖而出还有另一个原因。建立该模型的人工智能初创公司DeepSeek已将该模型作为“开放权重”发布,这意味着研究人员可以研究和构建该算法。该模型可以自由重复使用,但不被视为完全开源,因为其训练数据尚未公开。
德国埃尔兰根马克斯普朗克光科学研究所人工智能科学家实验室负责人Mario Krenn表示:“DeepSeek的开放性非常了不起。”
相比之下,OpenAI开发的o1和其他模型,包括其最新成果o3,都“本质上是黑匣子”。
虽然DeepSeek尚未公布R1的全部训练成本,但其向用户收取的费用约为o1运行成本的三十分之一。该公司还创建了R1的迷你“精简”版本,以允许算力有限的研究人员使用该模型。
“使用o1进行的实验成本超过300英镑,而使用R1的成本不到10美元,”Krenn 说。“这是一个巨大的差异,肯定会对其未来的采用产生影响。”
「93913原创内容,转载请注明出处」