通过声纳进行眼动追踪，研究人员旨在使VR头显更加高效

🤖 由文心大模型生成的文章摘要

美国纽约康奈尔大学研究人员开发了一种类似声纳技术的原型，可以取代摄像头来追踪眼球运动。该原型基于微型扬声器，可发出频率高于18 kHz的声音，这超出了大多数人的听力范围。

声音反射用户脸部、并由头显两侧的四个麦克风接收，研究人员使用一种称为GazeTrak的算法来解读声波，以确定头显用户注视方向。

研究团队表示，声纳技术具有以下几大优点：与基于摄像头的系统相比，可以降低功耗，并且由于摄像头不会持续记录，具备更好的隐私性，且还能降低VR头显的制造成本和重量。

在对20名参与者测试时，基于声纳技术的眼动追踪显示准确度高达3.6度，尽管不如当前的高端设备（例如Apple Vision Pro）准确，不过，研究人员认为这种性能对于大多数虚拟现实应用来说应该足够。

然而，该系统有一个主要缺点：由于每个人的眼球形状不同，GazeTrak使用的AI模型必须针对每个用户单独进行训练。为了将眼球追踪声纳商业化，必须收集足够的数据来创建通用模型。

眼动追踪是虚拟现实的一项关键技术，支持用户通过查看特定点来导航菜单或与虚拟环境中的其他化身进行眼神交流，Vision Pro便能基于精确的眼动追踪以改善用户体验。

眼动追踪还支持呈现正在查看的区域详细表示和外围不太详细的表示（注视点渲染）来实现用户焦点的渲染。该技术还支持创新的控制方法，例如 VR游戏「Before Your Eyes」，玩家只需用眼睛即可操控。

虽然眼动追踪具备以上优势，但是市场领导者Meta仍决定不在Meta Quest3上应用该技术，理由是制造成本、重量和所需的计算力。到目前为止，Meta仅在Quest Pro中采用了眼动追踪。

而Meta首席技术官博斯沃思相信，眼动追踪终有一天会成为标准：“作为与双手结合的2D导航UI范式，我们确实对眼动追踪技术进行了很长时间的测试，这是制造成本、重量和所需计算力之间的权衡，我们专注于能够在更高效的架构中以高精度提供这项功能，这样就可以将眼动追踪应用于每一台头显。”

「93913原创内容，转载请注明出处」

相关文章