🤖 由 文心大模型 生成的文章摘要
Whispr平台有三个核心组件。第一个是Guide Builder,一个基于桌面的应用程序,用于将标准操作程序(SOP),清单,手册等从PDF和其他格式传输到Whispr系统。Whispr将这些文档转换为语音指导,然后通过专用移动应用程序为Android和iOS设备上的前线工作人员部署。
对于文本到语音(TTS)元素,Whispr使用Google的WaveNet合成语音,而其所有自动语音识别(ASR)都在设备上运行,这意味着服务不需要互联网。
虽然Whispr仍然处于萌芽阶段,但看到它的语音指导平台与基于视觉的技术(如增强现实眼镜)相结合将会很有趣。
第三个关键组件是数据。随着时间的推移,Whispr能够更好地理解所询问的问题,可以使用此数据来改进指导和流程。
此外,Whispr最终将推出应用程序编程接口(API),以便公司可以将其集成到自己的软件中。这感觉它可能是该技术的更好用例,特别是对于那些可能更倾向于将语音指导智能集成到他们自己的现有应用程序中的大公司。
我们已经看到微软如何使用远程协助等混合现实应用程序,让技术人员和专家远程查看前线工作人员可以看到的内容并帮助他们解决远程的问题。通过观察视觉数据和AI语音可以改善口头指导。此外,Whispr正在研发其用于“感官数据收集”的AR头显的测试版。
【93913原创内容,转载请注明及回链】
【93913原创内容,转载请注明及回链】