阿里巴巴旗下AI旗舰应用夸克AI超级框有了重大动作,其发布了全新AI相机,并特别推出 “拍照问夸克” 功能。此次更新基于强大的视觉理解与思考推理模型能力,将为用户带来一系列全新体验,推动智能搜索进入新的发展阶段。
在日常生活、学习和工作场景中,用户常常会面临复杂物体、表格和图形等难以用语言准确描述真实需求的情况。全新的夸克AI相机凭借其强大的功能,能够深入洞察用户意图,让视觉搜索、多轮问答、图像处理与创作变得更加轻松便捷。
“拍照问夸克” 功能基于AI超级框背后先进的视觉理解和推理模型能力,用户无论是在手机还是电脑端,都可以利用这一功能进行图片搜索、问答、思考、编辑以及创作。这一全新的多模态产品入口和交互体验,正逐渐成为AI时代用户表达问题和获取信息的关键方式。
该功能的识别精准度令人惊叹,它能够精准识别图片中的人物、物体以及各种细微细节,并且能够深入理解用户需求,联想出与之相关的问题。举例来说,当用户拍照搜索文物时,它会自动关联该文物的历史背景等相关信息;要是上传商品图片,系统则会一键跳转至淘宝同款链接。不管是人物、动物、植物、建筑、风景、美食、艺术品、商品、外文资料,还是故障代码等,夸克都能在极短的时间内完成识别,并且经过多轮问答和深度思考,给出在同类产品中极具优势的回答。
过去,用户若要完成围绕 “图片” 的复杂任务,往往需要在多个AI工具之间来回切换,操作繁琐。如今,夸克对“超级Agent”在视觉搜索方面的产品体验和使用场景进行了大幅提升,致力于满足用户对现实物理世界的解读、处理和创作需求。“拍照问夸克” 功能将搜索、扫描、修图、翻译、创作等多种能力聚合在一个统一入口。对于较为复杂的图像,用户一次最多可上传10张图片,让AI进行深度推理,从而完成各类复杂任务。目前,夸克拥有超百个专业Agent和原子能力,涵盖搜索、健康、学习、旅游、商品、创作等多个领域,并持续通过模型能力升级来优化Agent 组合策略,以满足用户对图像信息的个性化需求。
在实际应用场景中,“拍照问夸克” 功能展现出了强大的实用性。在旅行场景中,它就像一位如影随形的 “专业导游”,用户边逛边拍,就能获取文物讲解、景点攻略等信息;工作中,它可以辅助分析数据图表、优化代码逻辑,还能生成工作总结文档;在健康领域,用户上传体检报告,它会给出指标异常分析以及康复方案建议;娱乐场景里,它支持棋牌指导、截图找剧、情头配对等趣味功能,同时还能一键完成高清化、去水印、原文溯源等操作。此外,“拍照问夸克” 还支持多种语言提问和翻译解读,方便不同语言背景的用户使用。