Facebook致力于将文本、图像翻译功能集成至AR智能眼镜

🤖 由 文心大模型 生成的文章摘要

据外媒Next Reality报道,众所周知基于智能手机摄像头Google Lens应用可实现翻译文本,而苹果则通过Live Text将类似功能引入iPhone,如今Facebook也进军了该领域,旨在通过计算机视觉技术处理实时文本、图像翻译,并致力于将这项功能集成至AR智能眼镜。

近日,Facebook研究员Praveen Krishnan及Tal Hassner发表了一份研究报告,该报告详细介绍了一种名为“TextStyleBrush”的AI模型,该模型可以通过智能手机摄像头查看单个键入或手写的单词,并模拟其字体以及在摄像头视图中用另一个单词虚拟拼写替换原始文本。

“TextStyleBrush的工作方式类似于文字编辑器画笔工具的工作方式,区别于其可识别图像中的文字,不同于定义字体等参数检测方法,我们采用了更全面的AI识别机制,从而实现将文本、图像内容单独分离进行分析。”

随着越来越多的APP实现AR功能,特别是谷歌和苹果旗下应用开通了AR功能之后,Facebook也明显加速了其AR开发步伐,该公司也旨在将“TextStyleBrush”技术集成至未来推出的AR智能眼镜之中,想象一下当你戴着AR眼镜实时翻译路边路牌时是多么酷的一件事。

此外,TextStyleBrush字体识别功能还可复制字体或手写样本并将其应用于整个文本块,由于这项功能具有高度的文本伪造性,为防止被不法分子用于违法行径,Facebook选择开源该模型代码。

显而易见,与谷歌及苹果侧重于开发AR应用不同,Facebook则致于将AR实用功能集成至AR智能眼镜,这或许能助其超越对手。

「93913原创内容,转载请注明及回链」