OpenAI宣布最新人工智能大语言模型“GPT-4o”,将使ChatGPT更智能、更易于使用

🤖 由 文心大模型 生成的文章摘要

OpenAI宣布了其最新的人工智能大语言模型,据称该模型将使ChatGPT更智能、更易于使用。

新型号称为GPT-4o,是该公司一年多前推出的上一代GPT-4型号的更新版本。该模型将向免费客户开放,这意味着任何人都可以通过ChatGPT访问OpenAI最先进的技术。

根据演示,GPT-4o将有效将ChatGPT转变为可进行实时语音对话的数字个人助理,还能使用文本和“视觉”进行交互,这意味着可查看用户上传的屏幕截图、照片、文档或图表,并进行对话。

OpenAI首席技术官Mira Murati表示,GPT-4o还将具有记忆功能,这意味着可从之前与用户的对话中学习,并且可以进行实时翻译。

“这是我们第一次在易用性方面真正迈出一大步,”Murati在OpenAI旧金山总部现场演示中表示,“这种互动变得更加自然,也更加容易。”

GPT-4o发布之际,OpenAI力求在日益激烈的人工智能竞赛中保持领先地位。包括谷歌和 Meta在内的竞争对手一直致力于构建日益强大的大型语言模型,为聊天机器人提供动力,并将人工智能技术引入各种其他产品。

OpenAI活动在Google年度I/O开发者大会前一天举行,预计谷歌将在会上宣布其Gemini AI 模型的更新。与GPT-4o一样,谷歌Gemini也是多模式的,这意味着也可以解释和生成文本、图像和音频。同时,GPT-4o是在下个月,苹果全球开发者大会预计发布人工智能之前发布,苹果可能会将人工智能融入下一代iPhone或iOS。

而GPT-4o对微软来说是一个福音,微软已向OpenAI投资了数十亿美元,将其人工智能技术嵌入到微软产品之中。

OpenAI高管演示了与ChatGPT的语音对话,以获得解决数学问题的实时说明、并获得编码建议;ChatGPT能以自然、听起来像人类的声音以及机器人的声音说话,甚至还可以唱出部分回应,不仅如此该工具还能查看图表图像并进行讨论。

另外,ChatGPT还能通过自动翻译和响应以多种语言进行对话。OpenAI称,该工具现在支持 50多种语言。

“新的语音(和视频)模式是我用过的最好的计算机界面,”OpenAI首席执行官Sam Altman表示,“这感觉就像电影中的人工智能,达到人类水平的响应时间和表达能力是一个巨大的变化。”

此外,Murati表示,OpenAI将推出具有GPT-4o功能的ChatGPT桌面应用,为用户提供另一个与公司技术交互的平台。

GPT-4o将在未来几个月内推送,免费ChatGPT用户能与GPT-4o模型进行有限次数的交互,然后该工具会自动恢复依赖旧的GPT-3.5模型;付费用户将可以使用最新型号访问更多数量的消息。

OpenAI表示已有超过1亿人在使用ChatGPT,GPT-4o——以及在桌面上通过改进的语音对话与其进行交互的功能——可能会让更多的人有理由使用其技术。这些举措出台之际,谷歌和 Meta正将人工智能集成到Instagram和Google Assistant等更广泛使用的消费产品之中。

「93913原创内容,转载请注明出处」