🤖 由 文心大模型 生成的文章摘要
阿里即将于2025年4月第二周正式发布新模型Qwen3。作为阿里在2025年上半年最为关键的模型产品,Qwen3的诞生备受瞩目,其发布也预示着阿里在人工智能领域将迈出重要一步。自2024年9月阿里在云栖大会上推出Qwen2.5后,短短七个月的时间,阿里云内部的基础模型团队便马不停蹄地推动着Qwen3相关项目的进展。
然而,2025年初DeepSeek的异军突起,在AI领域掀起了一阵波澜,也在一定程度上改变了阿里云基础模型团队的思路与工作重心。一位知情人士透露:“早在2024年四季度,业内就已经察觉到模型推理能力的重要性,只不过当时还未将其视为最核心的发展方向。但随着DeepSeek的火爆,推理能力已然成为模型发展过程中不可忽视的关键要素。”在DeepSeek-R1发布后,阿里云基础模型团队迅速做出战略调整,将更多资源与精力向提升模型推理能力方向倾斜。不仅如此,在模型竞品对标方面,2024年下半年阿里云基础模型团队主要对标OpenAI的o1,而如今,DeepSeek-R1也已成为其重要的对标模型之一。
由于阿里推行模型开源策略,基于Qwen开源模型所衍生出的模型总量成为衡量模型影响力的关键指标。截至目前,这一数据已突破10万大关。而在开发者社区的受欢迎度方面,阿里综合考量多个具体指标,其中开源模型下载量便是重要参考之一。
2024年Qwen系列模型在开发者社区的下载量累计超过2亿次。有知情人士解释道:“在开发者社区中,一个模型的影响力主要体现在两个方面,即下载量和衍生模型数。开发者基于下载的开源模型进行微调,生成新的衍生模型后,会重新上传至开发者社区。因此,这两个维度能够较为直观地反映出一个开源模型在开发者群体中的人气高低。”
「93913原创内容,转载请注明出处」