谷歌正式推出一款全新人工智能工具,其核心目标是助力研究人员更为高效地探究科学现象。该工具被谷歌定义为AI联合科学家,它依托于Gemini 2.0运行,这是谷歌旗舰大型语言模型系列的最新版本。此系列中的大型语言模型具备处理多模态数据的能力,还拥有工具使用功能,能够在数据库等外部系统中执行各类操作。
研究人员可通过聊天机器人界面与谷歌的人工智能助理科学家展开交互。用户只需明确一个目标,比如为现有药物探寻新的临床应用方向,该工具便会提出实现这一目标的潜在方法。它不仅能生成多段式的研究计划,还能够检索包含与项目相关数据的学术论文。
用户可通过多种途径对合作科学家的输出进行定制。科学家不仅能够提供研究目标,还可以输入实现目标的提案,并要求人工智能对该想法进行审查。此外,用户还能针对合作科学家初步给出的快速反馈提供意见,以此协助其优化改进。
谷歌研究员Juraj Gottweis和Vivek Natarajan在一篇博文中提到:“除了标准的文献综述、总结以及‘深度研究’工具外,人工智能联合科学家系统旨在挖掘全新的原创知识,并制定出具有显著创新性的研究假设和建议。”
从底层架构来看,AI助理科学家由六个以上的AI代理驱动。这些均为机器学习程序,能够在高度自主的状态下执行操作。每个程序负责执行制定研究计划过程中不同子集的任务。
第一个代理名为Generation,它的作用是分析用户想要研究的科学现象,并生成一些试图解释该现象的假设。第二个代理是Ranking,它会在几个辅助AI代理的协助下完善这些假设。
其中,辅助代理Proximity负责删除重复的研究想法;另一个代理则借助公开的科学数据对剩余的研究提案进行审查;还有第三个代理Evolution,它能够简化AI助理科学家的输出内容,使其更便于理解。
该系统采用一种名为测试时间计算的方法来生成假设。这项技术能够通过增加人工智能模型用于生成快速响应的时间和基础设施,进而提升其输出质量。除了联合科学家所基于的 Gemini 2.0大型语言模型系列外,测试时间计算还得到了包括OpenAI o1在内的几种竞争模型的支持。
共同科学家用于开展研究的代理由主管代理进行协调。据谷歌表示,主管代理的职责之一是收集处理用户提示所涉及的计算统计数据。这些统计数据能够帮助共同科学家确定何时应结束处理并展示其针对提示的响应。