IBM扩展Granite模型系列,推出专为企业打造的全新多模式和推理AI

🤖 由 文心大模型 生成的文章摘要

IBM发布了Granite大型语言模型(LLM)系列的下一代产品——Granite 3.2。该产品延续了IBM致力于打造小型、高效且实用的企业级人工智能,力求对现实世界产生深远影响的理念。

所有Granite 3.2模型均在Hugging Face平台上以宽松的Apache 2.0许可形式发布。目前,部分模型已在IBM watsonx.ai、Ollama、Replicate和LM Studio上线。预计不久后,RHEL AI 1.5也将推出该模型,为企业及开源社区注入高级功能。其显著亮点如下:

新型视觉语言模型(VLM)助力文档理解:这款专为文档理解任务设计的VLM,在关键的企业基准测试DocVQA、ChartQA、AI2D和OCRBench 1中,展现出了卓越性能。其表现不仅可与规模大得多的模型(如Llama 3.2 11B和Pixtral 12B)相媲美,甚至在某些方面更胜一筹。

除了依靠强大的训练数据,IBM还运用自家开源的Docling工具包,处理了8500万份PDF文件,并生成了2600万个合成问答对,以此强化VLM处理复杂文档密集型工作流程的能力。

思维链功能提升推理效能:Granite 3.2的2B和8B模型具备思维链功能,有效增强了推理能力。同时,该功能可根据需求灵活开启或关闭,以优化效率。借助这一功能,8B模型在 ArenaHard和Alpaca Eval等指令跟踪基准测试中,相较于其前身实现了两位数的提升,且未对安全性或其他性能造成负面影响。此外,通过采用新颖的推理扩展方法,Granite 3.2 8B 模型经过校准,在AIME2024和MATH500等数学推理基准测试中,能够与Claude 3.5 Sonnet或GPT-4o等大型模型的性能相抗衡。

安全模型优化与新功能引入:Granite Guardian安全模型在尺寸缩小30%的情况下,仍保持了与之前Granite 3.1 Guardian模型相同的性能。Granite 3.2模型还引入了一项名为“言语化信心 的全新功能,该功能能够提供更为细致的风险评估,有效识别安全监控中的模糊之处。

战略成效显著:IBM为企业提供更小、更专业AI模型的战略在实际测试中持续彰显有效性。例如,Granite 3.1 8B模型近期在Salesforce LLM Benchmark for CRM的准确性测试中斩获高分。

强大的合作伙伴生态系统:Granite模型系列得到了强大合作伙伴生态系统的有力支持,其中不乏将LLM嵌入自身技术的领先软件公司。

「93913原创内容,转载请注明出处」