智谱发布新一代GLM-4-32B-0414系列模型,性能卓越支持本地部署

🤖 由 文心大模型 生成的文章摘要

智谱发布重磅消息,新一代GLM-4-32B-0414系列模型正式推出。此系列模型参数规模达320亿,在效果表现上可与OpenAI GPT系列以及DeepSeek V3/R1系列相媲美,并且具备极为友好的本地部署特性,为广大用户在模型使用上提供了更多便捷与可能。

该系列模型包含四款不同类型的模型,分别是GLM-4-32B-Base-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414和GLM-Z1-9B-0414 ,每款模型都有其独特的优势与应用方向。在前期的预训练阶段,模型采用了高达15T的高质量数据,其中大量推理类合成数据的运用,为后续强化学习扩展筑牢根基。而在后训练阶段,团队不仅针对对话场景实现了人类偏好对齐,还借助拒绝采样和强化学习等先进技术,强化了模型在指令遵循、工程代码、函数调用等方面的效果,进一步增强了智能体任务所需的原子能力。​

在实际应用效果方面,GLM-4-32B-0414在多个领域都取得了出色成绩。在工程代码编写、Artifacts生成、函数调用、搜索问答及报告撰写等方面表现亮眼,部分Benchmark测试结果甚至能够与参数规模更大的GPT-4o、DeepSeek-V3-0324(671B)等模型相抗衡。其中,GLM-Z1-32B-0414作为具有深度思考能力的推理模型,是在GLM-4-32B-0414基础上,通过冷启动和扩展强化学习,并针对数学、代码和逻辑等任务进行专门训练得到的。相较于基础模型,它在数理能力以及解决复杂任务的能力上有了显著提升。在训练过程中,团队引入基于对战排序反馈的通用强化学习,进一步提升了模型的通用能力。​

GLM-Z1-Rumination-32B-0414是具有沉思能力的深度推理模型,对标OpenAI Deep Research。该模型能够通过更长时间的深度思考来攻克更开放、更复杂的问题,例如撰写两个城市 AI 发展对比情况以及未来发展规划等。它还能结合搜索工具处理复杂任务,并且经过多种规则型奖励指导和扩展端到端强化学习训练,以提升解决复杂问题的能力。而GLM-Z1-9B-0414 作为一款开源的9B小尺寸模型,在数学推理和通用任务中展现出了极为优秀的能力,在同尺寸开源模型中处于领先地位。​

「93913原创内容,转载请注明出处」