国内最大AI图像创作平台 LiblibAI接入阿里通义系列大模型

🤖 由 文心大模型 生成的文章摘要

国内AI领域迎来一项重大进展,最大AI图像创作平台LiblibAI成功接入阿里通义系列大模型。这一合作标志着AI创作领域将迎来新一轮的革新,为广大创作者带来更为强大且高效的创作工具。​

在此次接入后,基于万相最新开源模型打造的文生视频、图生视频功能备受瞩目。用户只需输入提示词,或者上传一张图片,平台就能生成一段时长10秒的视频。以万相2.1(Wan2.1)为例,其性能卓越,在Hugging Face及魔搭社区的总下载量已超200万,在Github的Star数超8.7k。

万相视频生成模型在算法设计上独具匠心,它基于主流DiT架构和线性噪声轨迹范式,研发了高效的因果3D VAE、可扩展的预训练策略等。像在3D VAE 中,为了高效支持任意长度视频的编码和解码,万相在因果卷积模块中实现了特征缓存机制,代替直接对长视频端到端的编解码过程,从而实现了无限长1080P视频的高效编解码。并且,通过将空间降采样压缩提前,模型在推理时能够在不损失性能的情况下,进一步减少29%的内存占用。此外,1.3B 版本的视频生成模型仅需8.2GB显存即可生成高质量视频,在消费级显卡上就能运行,适用于二次模型开发和学术研究。​

除了视频生成功能的升级,LiblibAI在提示词优化方面也取得了重大突破。LiblibAI基于Qwen – turbo打造了全新的提示词窗口,通过预先设置好的系统提示(System Prompt),能帮助用户对提示词进行优化。不仅如此,该窗口还具备一项实用功能,可将中文提示词精准翻译为模型能够理解的英文提示词。

据LiblibAI官方介绍,在接入Qwen – turbo后,平台的提示词优化时间大幅缩短,超过了50%。这意味着创作者能够更快地获得更符合模型需求的提示词,极大地提升了创作效率。以一位经常使用AI创作的插画师为例,以往他花费在优化提示词上的时间可能要20分钟左右,接入新功能后,同样的工作仅需不到10分钟就能完成,大大加快了他的创作流程。

「93913原创内容,转载请注明出处」