阿里发布通义 Wan2.2-I2V-Flash 模型：推理速度比 Wan2.1 提升 12 倍，图生视频更轻快

AI中国

AI技术专栏作家 | 发布了 246 篇文章

IT之家 8 月 11 日消息，阿里通义大模型今天宣布，Wan2.2-I2V-Flash 模型正式上线，其在将电影级视觉呈现装进模型的同时，生成速度和性价比也实现全面跃升。

IT之家从官方介绍获悉，Wan2.2-I2V-Flash 相比 Wan2.1 的推理速度提升 12 倍，且指令遵循能力大幅提升，各种特效提示词直出，且能精准控制运镜。同时，其对各类风格话图像也都能稳定保持风格，并实现合理、自然的动态效果。此外，其价格为 0.1 元 / 秒，抽卡成功率相比 Wan2.1 提升 123%。目前，该模型可在阿里云百炼通过调用 API 来进行体验。

不久前的 7 月 28 日，阿里开源通义万相 Wan2.2，包含文生视频（Wan2.2-T2V-A14B）、图生视频（Wan2.2-I2V-A14B）和统一视频生成（Wan2.2-IT2V-5B）三款模型，其中文生视频模型和图生视频模型均为业界首个使用 MoE 架构的视频生成模型，总参数量为 27B，激活参数 14B；同时，首创电影美学控制系统，光影、色彩、构图、微表情等能力媲美专业电影水平。

相关阅读：