IBM扩展Granite模型系列，推出专为企业打造的全新多模式和推理AI

🤖 由文心大模型生成的文章摘要

IBM发布了Granite大型语言模型（LLM）系列的下一代产品——Granite 3.2。该产品延续了IBM致力于打造小型、高效且实用的企业级人工智能，力求对现实世界产生深远影响的理念。

所有Granite 3.2模型均在Hugging Face平台上以宽松的Apache 2.0许可形式发布。目前，部分模型已在IBM watsonx.ai、Ollama、Replicate和LM Studio上线。预计不久后，RHEL AI 1.5也将推出该模型，为企业及开源社区注入高级功能。其显著亮点如下：

新型视觉语言模型（VLM）助力文档理解：这款专为文档理解任务设计的VLM，在关键的企业基准测试DocVQA、ChartQA、AI2D和OCRBench 1中，展现出了卓越性能。其表现不仅可与规模大得多的模型（如Llama 3.2 11B和Pixtral 12B）相媲美，甚至在某些方面更胜一筹。

除了依靠强大的训练数据，IBM还运用自家开源的Docling工具包，处理了8500万份PDF文件，并生成了2600万个合成问答对，以此强化VLM处理复杂文档密集型工作流程的能力。

思维链功能提升推理效能：Granite 3.2的2B和8B模型具备思维链功能，有效增强了推理能力。同时，该功能可根据需求灵活开启或关闭，以优化效率。借助这一功能，8B模型在 ArenaHard和Alpaca Eval等指令跟踪基准测试中，相较于其前身实现了两位数的提升，且未对安全性或其他性能造成负面影响。此外，通过采用新颖的推理扩展方法，Granite 3.2 8B 模型经过校准，在AIME2024和MATH500等数学推理基准测试中，能够与Claude 3.5 Sonnet或GPT-4o等大型模型的性能相抗衡。

安全模型优化与新功能引入：Granite Guardian安全模型在尺寸缩小30%的情况下，仍保持了与之前Granite 3.1 Guardian模型相同的性能。Granite 3.2模型还引入了一项名为“言语化信心的全新功能，该功能能够提供更为细致的风险评估，有效识别安全监控中的模糊之处。

战略成效显著：IBM为企业提供更小、更专业AI模型的战略在实际测试中持续彰显有效性。例如，Granite 3.1 8B模型近期在Salesforce LLM Benchmark for CRM的准确性测试中斩获高分。

强大的合作伙伴生态系统：Granite模型系列得到了强大合作伙伴生态系统的有力支持，其中不乏将LLM嵌入自身技术的领先软件公司。

「93913原创内容，转载请注明出处」

IBM扩展Granite模型系列，推出专为企业打造的全新多模式和推理AI

相关文章

人工智能推动英伟达市值2024年增长2万亿美元

可口可乐与微软建立战略合作伙伴关系，以加速云和生成式人工智能项目

Meta 3D Gen：文本到3D资产生成的一种新的先进快速管道

字节跳动豆包大模型团队开源COMET技术，大幅提升大模型训练效率并降低成本

英伟达推出适用于RTX AI PC的AI基础模型

英伟达年度GTC大会开幕，字节跳动、阿里云登台亮相

推荐

重磅突破！开发人员成功实现PS VR2 HDR在PC端的部分运行

中国移动发布移动爱家AI眼镜，深度融入大模型实现多场景体验升级

苹果专利新进展：可适形HMD、EyeSight技术

影目科技与中国移动达成深度生态合作，引领智能眼镜新潮流

AI应用推荐

热门

重磅突破！开发人员成功实现PS VR2 HDR在PC端的部分运行

中国移动发布移动爱家AI眼镜，深度融入大模型实现多场景体验升级

友情链接

推荐

重磅突破！开发人员成功实现PS VR2 HDR在PC端的部分运行

中国移动发布移动爱家AI眼镜，深度融入大模型实现多场景体验升级

苹果专利新进展：可适形HMD、EyeSight技术

影目科技与中国移动达成深度生态合作，引领智能眼镜新潮流