国内最大AI图像创作平台 LiblibAI接入阿里通义系列大模型

🤖 由文心大模型生成的文章摘要

国内AI领域迎来一项重大进展，最大AI图像创作平台LiblibAI成功接入阿里通义系列大模型。这一合作标志着AI创作领域将迎来新一轮的革新，为广大创作者带来更为强大且高效的创作工具。

在此次接入后，基于万相最新开源模型打造的文生视频、图生视频功能备受瞩目。用户只需输入提示词，或者上传一张图片，平台就能生成一段时长10秒的视频。以万相2.1（Wan2.1）为例，其性能卓越，在Hugging Face及魔搭社区的总下载量已超200万，在Github的Star数超8.7k。

万相视频生成模型在算法设计上独具匠心，它基于主流DiT架构和线性噪声轨迹范式，研发了高效的因果3D VAE、可扩展的预训练策略等。像在3D VAE 中，为了高效支持任意长度视频的编码和解码，万相在因果卷积模块中实现了特征缓存机制，代替直接对长视频端到端的编解码过程，从而实现了无限长1080P视频的高效编解码。并且，通过将空间降采样压缩提前，模型在推理时能够在不损失性能的情况下，进一步减少29%的内存占用。此外，1.3B 版本的视频生成模型仅需8.2GB显存即可生成高质量视频，在消费级显卡上就能运行，适用于二次模型开发和学术研究。

除了视频生成功能的升级，LiblibAI在提示词优化方面也取得了重大突破。LiblibAI基于Qwen – turbo打造了全新的提示词窗口，通过预先设置好的系统提示（System Prompt），能帮助用户对提示词进行优化。不仅如此，该窗口还具备一项实用功能，可将中文提示词精准翻译为模型能够理解的英文提示词。

据LiblibAI官方介绍，在接入Qwen – turbo后，平台的提示词优化时间大幅缩短，超过了50%。这意味着创作者能够更快地获得更符合模型需求的提示词，极大地提升了创作效率。以一位经常使用AI创作的插画师为例，以往他花费在优化提示词上的时间可能要20分钟左右，接入新功能后，同样的工作仅需不到10分钟就能完成，大大加快了他的创作流程。

「93913原创内容，转载请注明出处」

国内最大AI图像创作平台 LiblibAI接入阿里通义系列大模型

相关文章

标普500指数收益将投资者的注意力引向科技和人工智能

英伟达采用Apple Vision Pro以控制人形机器人

英伟达与谷歌合作设计量子计算处理器

微软将于10月面向测试人员发布Windows Recall AI搜索功能

IDC预测，到2030年，人工智能将为全球经济贡献19.9万亿美元

FPS游戏《孤声VR》扮演未来人工智能机器人

推荐

93913产业周报│3月24日-3月30日XR产业动态回顾

93913产业周报│3月24日-3月30日AI产业动态回顾

反乌托邦VR动作角色扮演游戏「Resist」即将登陆PS VR2

VR空战模拟游戏「雷霆王牌」新预告：震撼战斗场景燃爆来袭！

AI应用推荐

热门

93913产业周报│3月24日-3月30日XR产业动态回顾

93913产业周报│3月24日-3月30日AI产业动态回顾

友情链接

推荐

93913产业周报│3月24日-3月30日XR产业动态回顾

93913产业周报│3月24日-3月30日AI产业动态回顾

反乌托邦VR动作角色扮演游戏「Resist」即将登陆PS VR2

VR空战模拟游戏「雷霆王牌」新预告：震撼战斗场景燃爆来袭！