OpenAI宣布最新人工智能大语言模型“GPT-4o”，将使ChatGPT更智能、更易于使用

🤖 由文心大模型生成的文章摘要

OpenAI宣布了其最新的人工智能大语言模型，据称该模型将使ChatGPT更智能、更易于使用。

新型号称为GPT-4o，是该公司一年多前推出的上一代GPT-4型号的更新版本。该模型将向免费客户开放，这意味着任何人都可以通过ChatGPT访问OpenAI最先进的技术。

根据演示，GPT-4o将有效将ChatGPT转变为可进行实时语音对话的数字个人助理，还能使用文本和“视觉”进行交互，这意味着可查看用户上传的屏幕截图、照片、文档或图表，并进行对话。

OpenAI首席技术官Mira Murati表示，GPT-4o还将具有记忆功能，这意味着可从之前与用户的对话中学习，并且可以进行实时翻译。

“这是我们第一次在易用性方面真正迈出一大步，”Murati在OpenAI旧金山总部现场演示中表示，“这种互动变得更加自然，也更加容易。”

GPT-4o发布之际，OpenAI力求在日益激烈的人工智能竞赛中保持领先地位。包括谷歌和 Meta在内的竞争对手一直致力于构建日益强大的大型语言模型，为聊天机器人提供动力，并将人工智能技术引入各种其他产品。

OpenAI活动在Google年度I/O开发者大会前一天举行，预计谷歌将在会上宣布其Gemini AI 模型的更新。与GPT-4o一样，谷歌Gemini也是多模式的，这意味着也可以解释和生成文本、图像和音频。同时，GPT-4o是在下个月，苹果全球开发者大会预计发布人工智能之前发布，苹果可能会将人工智能融入下一代iPhone或iOS。

而GPT-4o对微软来说是一个福音，微软已向OpenAI投资了数十亿美元，将其人工智能技术嵌入到微软产品之中。

OpenAI高管演示了与ChatGPT的语音对话，以获得解决数学问题的实时说明、并获得编码建议；ChatGPT能以自然、听起来像人类的声音以及机器人的声音说话，甚至还可以唱出部分回应，不仅如此该工具还能查看图表图像并进行讨论。

另外，ChatGPT还能通过自动翻译和响应以多种语言进行对话。OpenAI称，该工具现在支持 50多种语言。

“新的语音（和视频）模式是我用过的最好的计算机界面，”OpenAI首席执行官Sam Altman表示，“这感觉就像电影中的人工智能，达到人类水平的响应时间和表达能力是一个巨大的变化。”

此外，Murati表示，OpenAI将推出具有GPT-4o功能的ChatGPT桌面应用，为用户提供另一个与公司技术交互的平台。

GPT-4o将在未来几个月内推送，免费ChatGPT用户能与GPT-4o模型进行有限次数的交互，然后该工具会自动恢复依赖旧的GPT-3.5模型；付费用户将可以使用最新型号访问更多数量的消息。

OpenAI表示已有超过1亿人在使用ChatGPT，GPT-4o——以及在桌面上通过改进的语音对话与其进行交互的功能——可能会让更多的人有理由使用其技术。这些举措出台之际，谷歌和 Meta正将人工智能集成到Instagram和Google Assistant等更广泛使用的消费产品之中。

「93913原创内容，转载请注明出处」

OpenAI宣布最新人工智能大语言模型“GPT-4o”，将使ChatGPT更智能、更易于使用

相关文章

Facebook针对PyTorch推出3D深度学习库

雷朋Meta智能眼镜即将增加多模式人工智能输入功能

2023南京文化科技融交会“XR+文旅”产业生态创新应用论坛邀请您共谋数字文旅新纪元

加料不加价的iPhone 13，到底香不香？

Pico持续完善用户社区体验，CEO周宏伟入驻官方社区&Pico VR助手更新在即

工业和信息化部文化和旅游部推动5G+VR/AR沉浸式旅游等应用场景规模发展

推荐

亿境虚拟在2025中国AI眼镜产业发展大会展示SW3030 AI眼镜方案

Meta Hypernova眼镜价格、功能和输入设备已公布

小米、字节等厂商AI智能眼镜有望二季度发布

大朋VR将于第二季度推出AI眼镜新品DPVR AI Glasses

AI应用推荐

热门

亿境虚拟在2025中国AI眼镜产业发展大会展示SW3030 AI眼镜方案

Meta Hypernova眼镜价格、功能和输入设备已公布

友情链接

推荐

亿境虚拟在2025中国AI眼镜产业发展大会展示SW3030 AI眼镜方案

Meta Hypernova眼镜价格、功能和输入设备已公布

小米、字节等厂商AI智能眼镜有望二季度发布

大朋VR将于第二季度推出AI眼镜新品DPVR AI Glasses