苹果已申请采用先进机器学习的基于视觉手势定制专利

🤖 由 文心大模型 生成的文章摘要

美国专利局公布了苹果一项与基于视觉的手势定制相关的专利申请。​

基于视觉的手势定制领域正日益受到关注。苹果指出,随着训练数据获取途径的增多,以及计算硬件朝着更强大、高效方向发展,机器学习技术近年来热度飙升。机器学习借助所执行的模型,能够针对特定应用给出预测,手势识别便是其中典型应用之一。

手势识别技术极大地推动了人与机器间的交流,使之变得无缝且直观。其应用领域极为广泛,涵盖虚拟现实、游戏以及智能家居控制等多个方面。​

然而,在支持不同领域的人机交互应用时,手势的自动识别面临诸多挑战。如今,人们不再满足于仅能识别预定义手势,而是期望用户能够通过自定义方式,定义并个性化属于自己的手势。这种自定义手势具有诸多优势,比如有助于增强用户对操作的记忆,提升操作效率,同时为有特殊需求的人群提供更广泛的便利,提升产品的包容性。但要切实有效地实现自定义,不仅需要高效且用户体验良好的数据收集程序,还需应对从有限样本中学习这一难题,也就是所谓的少量学习(FSL)问题。​

少量学习(FSL)是一项极具挑战性的任务,在此过程中,模型需高效整合先前知识与极少的新信息,避免出现过度拟合现象。为攻克FSL在手势识别方面的难题,研究人员探索了多种算法,包括迁移学习、微调,以及通过各类技术对少量数据进行增强等策略。不过,当模型最初训练所基于的源手势与目标手势差异显著,且涉及一组全新类别时,这些策略的适用性往往受限。​

另外,不同类型的数据适用不同的增强方法。举例来说,适用于图像的增强技术,可能并不适用于时间序列传感器数据。生成建模同样面临困境,如数据幻觉相关问题,致使其在数据合成方面的可靠性欠佳。相对而言,元学习的部分特性能够通过提升模型的有效学习能力,来应对FSL的挑战。​

本主题技术的实施例创新性地引入了基于元学习的手势定制综合框架,成功攻克FSL在手势识别领域的难题。​

与其他仅支持有限类型手势的技术不同,本主题技术的实施例借助一个或多个成像传感器(如RGB相机),能够适配各类手势,包括静态、动态、单手以及双手手势。​

本主题技术仅需用户进行一次演示(如捕捉一系列帧上的手势),即可完成定制。该技术融合了图形变换器、迁移学习以及元学习技术。具体而言,通过利用预先训练的图形变换器深度神经网络,助力小样本学习,并借助元学习与元增强技术的协同作用,为整个过程提供有力支持。​

该主题技术的实现,显著提升了给定电子设备向用户(如该电子设备的使用者)提供基于传感器的机器学习生成反馈的能力。

「93913原创内容,转载请注明出处」