Meta发布了开源Llama人工智能(AI)模型的最新版本,该模型在AI社区引起了轩然大波。
随着人工智能竞赛的持续升温,行业专家正在研究Meta Llama 3模型的功能,并将其与谷歌、OpenAI和Anthropic等科技巨头的竞争对手产品进行比较。凭借增强性能和可访问性,Llama 3模型或能重塑竞争格局并使人工智能体验大众化。
人工智能公司ClearML首席执行官Moses Guttmann表示:“Meta Llama 3以其先进的功能,有望在开源生成人工智能市场树立新的基准。通过突破开源模型所能实现的极限,Llama 3全面加速创新,这些最新进展重申了我们对开源人工智能与闭源替代方案竞争的信念。”
Meta首席执行官扎克伯格宣布推出了Llama 3 AI模型,该模型为Meta AI提供支持,目前已集成到Messenger和Instagram等各种Meta产品之中。
扎克伯格表示:“我们正在使用最先进的Llama 3人工智能模型来升级Meta AI,我们已将该模型开源,通过新模型,我们相信Meta AI现在是用户可以自由使用的最智能的人工智能助手。”
扎克伯格宣布,Llama 3模型的两个较小变体(分别具有80亿和700亿个参数),与基于用于评估模型质量的标准性能基准的其他免费模型相比,表现良好。他还指出,包含4000亿个参数的Llama 3最大版本仍在训练中。
Llama 3的训练数据集比其前身Llama 2大七倍。在实践中,会优先考虑数据集的质量和多样性,而不仅仅是数据集的大小,以获得令人满意的输出。同时,模型训练的参数集越大,它可以实现的单词之间的上下文理解就越多。
Cogito Finance首席执行官Cloris Che讨论了Meta在其公告中强调的基准,并指出其中包括标准行业指标,如MMLU和Meta的专有评估测试。据报道,Llama 3 70B Instruct模型在这些测试中的表现优于GPT-3.5和Claude Sonnet等竞争对手。
数字化转型公司Focused Labs首席执行官Austin Vance表示,Llama 3的主要优势之一是它有两种尺寸:小型和大型型号。他表示,该小型模型的性能优于OpenAI GPT 3.5 Turbo无障碍版本,推理时间更快,并且具有开源的额外优势。
“这使得企业能使用相对便宜的硬件在基础设施上部署模型,从而能控制安全环境、数据和开发工作流程,而不会产生与OpenAI相关的大量成本。”
Vance表示,更大的Llama 3模型也令人印象深刻,在信息回忆、数学能力和对话风格方面优于迄今为止的所有开源模型;尤其是信息回忆值得注意,自然的对话流程证明了该模型的复杂性。
“通过Llama3,Meta已成为开源AI领域与谷歌和微软抗衡的力量,履行了马斯克为OpenAI设想的角色。”
AnswerRocket联合创始人Mike Finley表示,新Llama模型拥有约80亿个神经元,该模型的训练时间似乎比开源模型的训练时间要长得多。
“实际上,这意味着我们更接近于拥有可以在边缘设备上运行的模型(首先是手机和平板电脑,然后是POS设备和汽车,接着是芯片卡和起搏器)。”
Meta新人工智能模型证明开源软件可以在性能和创新方面与专有或“封闭”模型相媲美,并强调了Meta使其人工智能技术变得易于使用将挑战封闭系统的主导地位。
“此外,随着Llama模型变得更加强大,Meta则会鼓励促进开源社区更多协作项目和伙伴关系,从而培育一个更加充满活力的生态系统,”
Meta是支持开源人工智能软件计划的几家公司之一。同样,马斯克的xAI也通过开源其人工智能聊天机器人Grok掀起波澜,许多人认为这是实现人工智能技术大众化并刺激商业用途创新的一步。
Grok模型已通过GitHub和BitTorrent等平台向X Premium+订阅者提供。这一发布与马斯克对OpenAI缺乏透明度的批评相一致,他与OpenAI就其人工智能模型进行的法律对抗凸显了这一点。
“Llama 3是开源社区一个非常重要的发展,而在分析标准基准测试的单个结果时,70B Instruct模型几乎与谷歌Gemini相当。”Cloris Che表示。