Meta CTO:AI与元宇宙构筑未来生活

🤖 由 文心大模型 生成的文章摘要

作者:Andrew Bosworth,Meta CTO兼Reality Labs负责人

主要观点:

●Meta在未来技术上的两大长期投资——人工智能(AI)和元宇宙——在2023年都取得了重大进展。更重要的是,这两者开始交汇。

●Meta在2023年取得的进展意味着生成型AI正在成为世界上最受欢迎应用的核心;混合现实现已成为大众市场头显的核心;Ray-Ban Meta智能眼镜将首次让AI从我们的视角看世界。

●我们相信,尖端AI最强大的表现之一将是像Meta AI这样能理解你周围的世界、并在你的一天中帮助你、最终无需提示即可操作的助手。

比尔·盖茨曾说过,人们会“高估接下来一年内发生的变化,低估接下来十年内发生的变化”。技术的单点突破往往以非线性方式积累,直到未来突然近在眼前。正如老话所说,技术变革发生的方式有两种:Gradually,then Suddenly(微小的变化日积月累,突然间改变世界)。在我们结束这激动人心的12个月的技术进步之际,我认为可以公平地说,2023年是一个“突然”的一年。

上个月,我们庆祝了我们FAIR实验室(Fundamental AI Research Lab)成立10周年。当我们在2013年成立这一实验室时,整个行业对AI未来将扮演的角色感到非常兴奋,早期的机器学习应用已经在Facebook各个方面发挥着核心作用。当时很少有人能想象到如今AI的进展会如此令人印象深刻。事实上,就在两年前,许多人可能还对AI的前景抱有疑虑。

展望2024年,另一个重大里程碑即将到来:自Meta开始在Reality Labs研究未来计算平台以来将满10年。这两种新兴技术——AI和元宇宙——代表了Meta对未来的长期押注。而在2023年,我们开始看到这两条技术路径以大众产品的形式交汇。

AI

在AI领域,今年的一个亮点是看到开发者社区如何接受Llama和Llama 2,它们的下载量超过了1亿次,并且来自全球各地的组织在不断改进和迭代。在印度,Jio迅速对其进行微调,为其五亿多客户建立了一个新工具。HuggingFace的Open LLM排行榜上有非常多基于Llama 2构建的令人印象深刻的项目,引领市场潮流。前面提到的这些,仅仅是托管的13000多个Llama变体中的一小部分。

像任何新技术一样,当AI对每个人都可用时将产生最大的影响。不久前,大多数人无法接触到使用文本提示生成美丽图像的工具。但今天,我们正在向全球数十亿人使用的产品中添加如协作生成图像、会话助手、写作助手和智能图像编辑器等等多样化的AI功能。

平台在转变

我们在过去一年中看到的转变表明,AI有一条通向成为主流人机交互方式的路径。这一舞台已经为可以以前所未有的方式感知、理解和与我们周围的世界互动的新型设备做好了准备。

Meta的AI驱动Ray-Ban Meta眼镜展示了其中一条路径。我们的新Meta AI助手结合视觉和语言理解,从你的视角看世界,并与你一起理解它。我们正在眼镜上测试新的多模态AI能力。启用此功能后,它们可以翻译您尝试阅读的外语,或为您拍摄的照片编写有趣的标题。而且它们可以全部免提完成,无需您拿出手机或操作应用程序。

我们相信,尖端AI最强大的表现形式之一,是成为可以理解你周围的世界,并在你的一天中提供帮助的助手,最终这一助手将无需任何提示词即可交互。眼镜是这种表现形式的理想选择——它们可以从你的视角看到和听到世界,它们已经在社交上可接受,它们可以全天佩戴,它们让你完全活在当下。

在Reality Labs,我们投入了多年时间,研究达成这一目标所需的技术——诸如超低功耗、始终开启的传感器,和能够理解你情境的机器感知系统。我们在这里不仅是在开创一种新型设备,还将在未来数年里推动它的发展。

混合现实和空间计算代表了另一条前进的道路。它们不仅仅是对过去50年占据主导地位的个人计算范式的渐进式改进,还代表着一种刚刚开始显现的根本性转变。

让尽可能多的人使用这些新技术一直是Reality Labs多年来的首要任务,因此在2023年9月,Meta发布的首款消费级MR头显Meta Quest 3对我们来说是另一个亮点。

在Meta Quest 3发布后的几个月里,Quest Store前20名应用中有七个是混合现实应用。我们看到了强烈的信号,表明人们确实重视这些体验。我们的商店中已经有数百个混合现实应用,大多数用户都尝试过混合现实功能。看到许多人使用这种新技术的情况令人愉快:

我们将在2024年看到这一进展加速,因为更多的人会接触混合现实,开发者将学会利用其力量。无论是在Xtadium上沉浸式观看NBA,还是在Pianovision上体验全新的音乐学习方法,我们已经看到MR提供了其他任何类型的设备都无法实现的体验。

长远眼光

对新兴技术进行长期投资并不容易。它不一定能奏效,当然也投入巨大。但这是技术公司可以做的最有价值的事情之一,也是长期保持影响力的唯一方式。Meta投入最大的两项长线技术今年都走向成熟并开始交汇,也再次提醒了我们维持健康的对未来技术的投资有多么重要。它还让我们对未来十年需要交付的创新有了更清晰的视野。

在AI方面,这代表着我们要全力以赴迎接接下来的事情:在这一代LLMs和生成型AI之后会出现什么?大多数研究人员都认为,利用我们今天拥有的技术,构建更大、更好的语言、图像和视频模型仍有巨大的机会。同时,还有许多基础性突破和全新架构等待被探索,我们Meta的AI研究团队正走在发现它们的道路上。

这也意味着对诸如具身智能(Embodied AI)的领域进行持续研究,旨在构建像人类一样体验世界的模型。我们的研究人员认为,走向人类级别AI的道路将需要对世界运作方式有更深入理解的系统,而我们的团队已经在这方面取得进展,未来还要继续进行多年的工作。

在Reality Labs方面,我们的研究人员正在推进一些最有前途的技术,这些技术将使下一个计算平台成为可能。多年来,这项研究已经带来了一些突破,例如Quest Pro和Quest 3上的Pancake镜头,以及Mark Zuckerberg和Lex Fridman今年试用的令人惊叹的Codec Avatars原型。这只是冰山一角,Reality Labs的研究突破将使我们能够在未来几年发布一系列行业首创产品。

但在我提到的所有事情中,最有价值的技术是今天人们手中的技术。2023年取得的进展意味着生成型AI正在成为世界上最受欢迎应用的核心,混合现实现已成为消费级头显的核心,智能眼镜将首次让AI从我们的视角看世界。这是一个极为激动人心的时刻,让我们得以构建未来。更重要的是,这是一个在未来世界生活的绝佳时机。

「93913原创内容,转载请注明出处」