声网在AWE2025推出对话式AI开发套件并开源

🤖 由 文心大模型 生成的文章摘要

在AWE2025上,实时互动云服务商声网成为了众人瞩目的焦点。此次展会上,声网正式推出了对话式AI开发套件,这一创新产品旨在助力智能硬件开发者打造具有卓越AI实时语音交互功能的产品,为用户带来前所未有的人机实时互动体验。更为引人注目的是,声网宣布该对话式AI开发套件的软硬件将全面开源,这一举措无疑将在行业内掀起一阵新的浪潮。​

声网的对话式AI开发套件是与芯片制造商博通集成(Beken)强强联合的成果。该套件基于博通集成的高性能AI芯片 BK7258,并融合了声网深度优化的对话式AI引擎,从而构建起一套完整的端侧实时交互系统。对于智能硬件开发者及制造商而言,这一套件提供了 “对话式AI+ 硬件芯片开发” 的一站式解决方案,极大地简化了开发流程。​

该开发套件在技术层面具备诸多显著优势。在语音活动检测(VAD)、实时语音混合、智能打断处理等先进技术和方案的支持下,其展现出五大突出特性。其一,AI对话体验几乎可以媲美真人交互。

声网对话式AI开发套件能够将AI与用户对话的延迟降低至 650ms,打断响应更是低至 340ms,如此低的延迟使得对话过程宛如真人聊天一般自然流畅。同时,其精准的语音识别能力,即便是在复杂的环境中,也能够准确无误地获取用户指令。其二,在多模态交互支持方面表现出色。它不仅提供了丰富多样的接口,还支持文本、视频、触控等多种交互方式,成功打造出集听、说、看、触于一体的交互形态,充分满足了开发者和用户多样化的需求。

其三,在当下开源成为主流趋势的背景下,开发者无需再耗费高昂的成本进行AI大模型的自研,接入其他企业开发的AI大模型变得更加省时省力。声网对话式AI开发套件兼容通义千问、豆包、DeepSeek 等国内常见的AI大模型,同时也允许开发者接入自己研发的大模型,给予了开发者极为丰富和自由的选择空间。其四,能够帮助开发者大幅缩短产品开发周期。由于该AI开发套件的软硬件全面开源,开发者只需下载开源代码,便可轻松将AI能力集成到自己的硬件设备中。

据声网介绍,开发者1小时即可跑通Demo,1天就能完成产品原型送样,这无疑大大缩短了产品的开发周期,降低了产品开发成本。此外,该套件采用了低功耗设计方案,能够实现超长待机,有效解决了移动便携类产品的续航焦虑问题,进一步扩大了其适用范围。​

声网对话式AI开发套件的应用场景十分广泛,涵盖了AI玩具、AI教育硬件、AI陪伴设备、家庭语音助手、穿戴设备-个人助手等多个领域。在AI教育硬件领域,它能够通过更准确的语音识别和更智能的人机交互,帮助学生更高效地学习;家庭语音助手借助该套件,可以更好地理解家庭成员的指令,提升家庭生活的便捷度;穿戴设备-个人助手则能在用户的日常活动中,随时提供精准的服务,提高工作效率。例如,AI情感陪伴机器人初创公司珞博 Robopoet此前发布的口袋AI毛绒宠物Fuzzoo,便搭载了声网的对话式AI技术,为用户提供了个性化交互体验。

「93913原创内容,转载请注明出处」