DeepSeek宣称,将公开其模型代码,进一步坚定在开源人工智能领域的投入。
该公司透露将开放5个代码存储库的源代码,并将这一行动形容为 “虽微小却饱含诚意的进步”,还表示会以“完全透明的方式”分享后续进展。
“我们在线服务里这些看似平凡的构建模块,都已经过详细记录、成功部署,并在实际应用中得到了充分检验。”
代码存储库,作为软件开发流程中极为关键的一环,是开发人员能够查阅项目代码、参与软件开发协作的重要存储场所。在代码存储库中,开发人员可以便捷地获取代码资料,进行代码的审查、修改以及添加新功能等操作。而开源存储库,由于其开放特性,通常会发布至如 GitHub、GitLab 等广受欢迎的集中托管服务平台,这些平台不仅为开源项目提供了稳定的存储空间,还极大地促进了全球范围内开发者之间的交流与合作,推动开源生态的繁荣发展。
上个月,DeepSeek发布的开源R1推理模型,在全球人工智能领域引发轰动。该模型不仅性能与西方同类系统相当,而且开发成本更低。
去年7月,DeepSeek创始人梁文峰表示,公司目前并不把AI模型的商业化作为首要目标,而是认为通过开源能够获得软实力。
“看到别人借鉴自己的创新成果,会带来极大的成就感。实际上,开源更多是一种文化行为,而非商业行为,为开源事业贡献力量能让我们赢得尊重。”
新发布的开源代码将基于现有的开源模型框架,为DeepSeek已公开分享的 AI 模型提供坚实的基础设施支持。
此前,DeepSeek发布了名为 Native Sparse Attention(NSA)的全新算法,旨在提升长上下文训练和推理的效率。
自上个月以来,DeepSeek的用户群体呈现出爆发式增长。Aicpb.com数据显示,在中国,它已成为最受欢迎的聊天机器人服务。截至1月11日,其日活跃用户数量达到2220万。