英伟达悄然发布了一款全新人工智能模型,其性能表现优于OpenAI和Anthropic的产品,标志着该公司人工智能战略的重大转变,并可能重塑该领域的竞争格局。
该模型名为“Llama-3.1-Nemotron-70B-Instruct”,低调亮相于热门人工智能平台Hugging Face,并因其在多项基准测试中的出色表现而迅速引起人们的关注。
英伟达称,新产品在关键评估中取得了最高分,包括Arena Hard基准测试85.0分、AlpacaEval 2 LC 57.6分和GPT-4-Turbo MT-Bench 8.98分。
这些分数超过了GPT-4o和Claude 3.5 Sonnet等备受推崇的模型,使英伟达跃居AI语言理解和生成的前沿。
此次发布对英伟达来说是一个关键时刻。该公司主要以图形处理单元主导地位而闻名,GPU为AI系统提供支持,现在该公司展示了其开发复杂AI软件的能力。此举标志着一项战略扩张,可能会改变AI行业的动态,挑战以软件为中心的公司在大型语言模型开发领域的传统主导地位。
英伟达创建Llama-3.1-Nemotron-70B-Instruct的方法包括使用先进的训练技术(包括从人类反馈中进行强化学习来改进Meta开源Llama 3.1模型。这种方法允许人工智能从人类偏好中学习,从而可能带来更自然、更符合情境的响应。
凭借其卓越的性能,该型号有可能为企业提供比市场上一些最先进型号更强大、更具成本效益的替代方案。
该模型无需额外提示或专门的标记即可处理复杂查询,这是它与众不同之处。在演示中,该模型正确回答了“Strawberry中有多少个r?”这个问题,并给出了详细而准确的回答,展示了对语言的细致理解和提供清晰解释的能力。
这些结果之所以特别重要,是因为我们强调“一致性”,这是人工智能研究中的一个术语,指的是模型的输出与用户的需求和偏好的匹配程度。对于企业来说,这意味着更少的错误、更多有用的响应,以及最终更高的客户满意度。