亚马逊发布新一代生成式AI模型Nova Sonic,语音处理能力实现重大突破

🤖 由 文心大模型 生成的文章摘要

亚马逊发布新一代生成式AI模型Nova Sonic,该模型在语音处理领域展现出卓越的性能,能够原生处理语音并生成自然流畅的语音输出,为用户带来前所未有的语音交互体验。亚马逊方面表示,在速度、语音识别以及对话质量等关键指标的基准测试中,Nova Sonic的表现足以与OpenAI和谷歌的前沿语音模型相媲美,这也标志着亚马逊在AI语音技术领域取得了重大进展。

近年来,随着人工智能技术的飞速发展,新兴AI语音模型不断涌现,像为ChatGPT语音模式提供支持的模型,它们在语音交互的自然度上有了显著提升,相比之下,亚马逊早期 Alexa等模型在这方面略显刻板。而Nova Sonic的问世,正是亚马逊对当前市场趋势的有力回应,旨在为用户提供更加自然、流畅的语音交互服务。​

Nova Sonic通过亚马逊Bedrock开发者平台向用户开放。Bedrock平台是亚马逊推出的用于构建企业级AI应用的重要工具,而Nova Sonic则通过全新的双向流式API接入该平台。这一创新的接入方式,使得开发者能够更加便捷将Nova Sonic集成到应用程序中,为企业级用户提供强大的语音交互功能。亚马逊特别强调,Nova Sonic 是市场上 “最具成本效益”的AI语音模型,其价格相较于OpenAI GPT-4o便宜约80%,这无疑为众多对成本敏感的开发者和企业提供了高性价比的选择。

据亚马逊高级副总裁兼人工通用智能 (AGI) 部门首席科学家罗希特・普拉萨德透露,Nova Sonic的部分组件已经为亚马逊升级版数字语音助手Alexa +提供了动力支持。Alexa +作为亚马逊语音助手的重要升级版本,旨在为用户提供更加智能、个性化的服务。Nova Sonic的加入,将显著提升Alexa +在语音识别、对话理解以及任务执行等方面的能力。

「93913原创内容,转载请注明出处」