快手发布可灵2.0视频生成模型及可图2.0图像生成模型

🤖 由文心大模型生成的文章摘要

快手举行“灵感成真”可灵AI 2.0模型发布会，并宣布基座模型再次升级，面向全球正式发布可灵2.0视频生成模型及可图 2.0图像生成模型。

据介绍，可灵2.0模型在动态质量、语义响应、画面美学等维度，保持全球领先；可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。

快手高级副总裁、社区科学线负责人盖坤透露，自去年6月发布以来，可灵AI已累计完成超20次迭代。截至目前，可灵AI全球用户规模突破2200万，过去的10个月里，其月活用户量增长25倍，累计生成超过1.68亿个视频及3.4亿张图片。

盖坤介绍称，两款模型在团队内部的多项胜负率评测中，均稳居业内第一。例如在文生视频领域，可灵2.0对比谷歌Veo2的胜负比为205%，对比Sora的胜负比达367%，在文字相关性、画面质量、动态质量等维度上显著超越对手。

基于MVL理念，可灵AI正式推出多模态编辑功能。“从今天起，大家可以在可灵AI的平台上体验我们的多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入，生成符合自己想法的创意视频。”盖坤介绍，MMW（多模态描述词）将不只局限于图片和视频，也可以引入其它模态的信息，例如声音、运动轨迹等，让用户实现更加丰富的表达。

全新的可灵2.0大师版在语义响应、动态质量、画面美学等方面显著提升生成效果。可灵2.0 大师版全面升级视频及图像创作可控生成与编辑能力，上线全新的多模态视频编辑功能，能灵活理解用户意图。支持在一段视频的基础之上，通过输入图片或文字，对生成的视频内容实现元素的增加、删减、替换，帮助创作者们实现更加灵活的二次编辑和处理。

据官方介绍，当前图生视频约占到可灵AI视频创作量的85%。在图像生成大模型领域，快手的可图 2.0 处于行业领先水平，拥有多项核心优势，诸如强大的复杂语义理解能力、电影级的画面质感、多条件的可控风格化生成等。在团队内部的多项胜负率评测中，相较于 Midjourney V7、FLUX1.1 (pro) 以及Reve等行业领先的图像模型，均保持明显优势。

包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上，可图2.0可支持60多种风格化的效果转绘，模型出图创意和想象力实现大幅跃升。

同时，可图2.0也上线了实用的图像可控编辑功能——局部重绘和扩图，支持图片的增加、修改和修复。在图像的多模态可控生成中，可图2.0还上线了全新的风格转绘功能，只需要上传一张图片加上风格描述，就能一键切换图片的艺术风格，同时精准保留原图的语义内容。

「93913原创内容，转载请注明出处」

快手发布可灵2.0视频生成模型及可图2.0图像生成模型

相关文章

百度计划今年下半年发布下一代人工智能模型

OpenAI允许企业定制GPT-4o

超星未来完成数亿元Pre-B轮融资，加码边缘侧大模型推理芯片

微软扩展AI模型战略，打造经济高效365 Copilot

阿里宣称开源AI模型性能超越DeepSeek R1

谷歌全新模型Gemini 2.5 Pro上线，推理能力引领行业新高度

推荐

重磅突破！开发人员成功实现PS VR2 HDR在PC端的部分运行

中国移动发布移动爱家AI眼镜，深度融入大模型实现多场景体验升级

苹果专利新进展：可适形HMD、EyeSight技术

影目科技与中国移动达成深度生态合作，引领智能眼镜新潮流

AI应用推荐

热门

重磅突破！开发人员成功实现PS VR2 HDR在PC端的部分运行

中国移动发布移动爱家AI眼镜，深度融入大模型实现多场景体验升级

友情链接

推荐

重磅突破！开发人员成功实现PS VR2 HDR在PC端的部分运行

中国移动发布移动爱家AI眼镜，深度融入大模型实现多场景体验升级

苹果专利新进展：可适形HMD、EyeSight技术

影目科技与中国移动达成深度生态合作，引领智能眼镜新潮流