Claude 3.5 Sonnet AI模型更新，支持自主执行计算机任务和保存用户击键

🤖 由文心大模型生成的文章摘要

Anthropic最新Claude 3.5 Sonnet AI模型在公测版中推出了一项新功能，可以通过查看屏幕、移动光标、单击按钮和键入文本来控制计算机。这项名为“计算机使用”的新功能现已在API上推出，开发者可以控制Claude像人类一样操作计算机。

Anthropic首席科学官Jared Kaplan表示，新的“计算机使用”功能可以告诉人工智能“将鼠标移动到哪里、在哪里点击、输入什么，以完成相当复杂的任务”。

微软Copilot Vision功能和 OpenAI ChatGPT桌面应用展示了AI工具可以根据查看计算机屏幕来做什么，谷歌Gemini Android手机应用也具有类似的功能。但几家厂商还没有采取下一步行动，广泛发布可以点击并执行用户此类任务的工具，Rabbit承诺R1也具有类似的功能，但目前尚未实现。

Anthropic称，AI模型操控计算机仍处于试验阶段，可能“繁琐且容易出错”。该公司表示，“我们提前发布支持操控计算机以征求开发者的反馈，并希望随着时间的推移，兼容性越来越好。”

Claude 3.5 Sonnet AI模型开发者介绍：

人们在电脑上经常做的许多操作（拖动、缩放等）Claude还无法尝试。Claude屏幕视图具有“翻页”特性（截取屏幕截图并将它们拼凑在一起，而不是观察更精细的视频流），这意味着可能会错过短暂的操作或通知。

Anthropic表示，新款Claude 3.5 Sonnet AI在许多基准测试中都有所改进，并且价格与前代产品相同：

更新后的Claude 3.5 Sonnet在行业基准测试中表现出广泛的改进，在代理编码和工具使用任务方面尤其取得了显著的进步。在编码方面，在SWE-bench Verified上的性能从33.4%提高到了49.0%，得分高于所有公开可用的模型——包括OpenAI o1-preview等推理模型和专为代理编码设计的专用系统。它还在零售领域将代理工具使用任务TAU-bench的性能从62.6% 提高到了69.2%，在更具挑战性的航空领域从36.0%提高到了46.0%。

「93913原创内容，转载请注明出处」

Claude 3.5 Sonnet AI模型更新，支持自主执行计算机任务和保存用户击键

相关文章

Meta推出Llama 3.2：适用于边缘和移动设备的小型AI模型

LeafyPod推出人工智能自动浇水智能花盆

伯恩斯坦：2025年人工智能贸易将转向电力和冷却

随着搜索竞争加剧，人工智能初创公司Perplexity增加购物功能

人工智能或是提高英国公共部门效率的关键

Iliad将投资30亿欧元增强欧洲人工智能基础设施

推荐

小派最新软件更新改进了Crystal Light VR头显追踪功能

苹果发布visionOS 2.4，集成Apple Intelligence、空间画廊和新iPhone

苹果公布一系列HMD专利申请，重点关注新型安全系统

Bigscreen Beyond 2首年销量已超过第一代

AI应用推荐

热门

小派最新软件更新改进了Crystal Light VR头显追踪功能

苹果发布visionOS 2.4，集成Apple Intelligence、空间画廊和新iPhone

友情链接

推荐

小派最新软件更新改进了Crystal Light VR头显追踪功能

苹果发布visionOS 2.4，集成Apple Intelligence、空间画廊和新iPhone

苹果公布一系列HMD专利申请，重点关注新型安全系统

Bigscreen Beyond 2首年销量已超过第一代