DeepSeek将分享部分AI模型代码，加倍开源

🤖 由文心大模型生成的文章摘要

DeepSeek宣称，将公开其模型代码，进一步坚定在开源人工智能领域的投入。

该公司透露将开放5个代码存储库的源代码，并将这一行动形容为 “虽微小却饱含诚意的进步”，还表示会以“完全透明的方式”分享后续进展。

“我们在线服务里这些看似平凡的构建模块，都已经过详细记录、成功部署，并在实际应用中得到了充分检验。”

代码存储库，作为软件开发流程中极为关键的一环，是开发人员能够查阅项目代码、参与软件开发协作的重要存储场所。在代码存储库中，开发人员可以便捷地获取代码资料，进行代码的审查、修改以及添加新功能等操作。而开源存储库，由于其开放特性，通常会发布至如 GitHub、GitLab 等广受欢迎的集中托管服务平台，这些平台不仅为开源项目提供了稳定的存储空间，还极大地促进了全球范围内开发者之间的交流与合作，推动开源生态的繁荣发展。

上个月，DeepSeek发布的开源R1推理模型，在全球人工智能领域引发轰动。该模型不仅性能与西方同类系统相当，而且开发成本更低。

去年7月，DeepSeek创始人梁文峰表示，公司目前并不把AI模型的商业化作为首要目标，而是认为通过开源能够获得软实力。

“看到别人借鉴自己的创新成果，会带来极大的成就感。实际上，开源更多是一种文化行为，而非商业行为，为开源事业贡献力量能让我们赢得尊重。”

新发布的开源代码将基于现有的开源模型框架，为DeepSeek已公开分享的 AI 模型提供坚实的基础设施支持。

此前，DeepSeek发布了名为 Native Sparse Attention（NSA）的全新算法，旨在提升长上下文训练和推理的效率。

自上个月以来，DeepSeek的用户群体呈现出爆发式增长。Aicpb.com数据显示，在中国，它已成为最受欢迎的聊天机器人服务。截至1月11日，其日活跃用户数量达到2220万。

「93913原创内容，转载请注明出处」

相关文章

马斯克牵头投资集团出价974亿美元收购OpenAI

DeepSeek热潮中，中国公司详细介绍了人工智能的应用

特朗普撤销拜登关于解决人工智能风险的行政命令

软银、OpenAI和甲骨文将成立“星际之门”合资企业，在美AI基础设施投资高达5000亿美元

SenseNova 5.0：AI模型性能超越OpenAI GPT-4

国内科技巨头持续大力发展人工智能

推荐

据报道，Valve新款VR头显将于2025年上市，售价不菲

达索系统推出面向产品设计和制造的Apple Vision Pro应用

苹果Apple Pencil相关专利公布，可用于操纵虚拟物体

苹果获得可折叠头显专利，可调节尺寸和形状，方便充电和携带

AI应用推荐

热门

据报道，Valve新款VR头显将于2025年上市，售价不菲

达索系统推出面向产品设计和制造的Apple Vision Pro应用

友情链接

推荐

据报道，Valve新款VR头显将于2025年上市，售价不菲

达索系统推出面向产品设计和制造的Apple Vision Pro应用

苹果Apple Pencil相关专利公布，可用于操纵虚拟物体

苹果获得可折叠头显专利，可调节尺寸和形状，方便充电和携带