AI热点 1月前 152 阅读 0 评论

MiniMax 发布视频生成工具 Hailuo 02,打破全球视频模型效果成本纪录

作者头像

AI技术专栏作家 | 发布了 246 篇文章

IT之家 6 月 18 日消息,MiniMax 稀宇科技宣布将连续五天发布重要更新,今天更新了第二弹 ——Hailuo 02。

据介绍,Hailuo 02 是目前全球唯一一个可以做到类似体操这种高度复杂的场景的模型,旨在帮助全球创作者更加充分地释放想象力,提升视频质量,降低创作门槛,同时又不给创作者增加太多成本负担。

团队坚持探索更高效的视频生成模型架构,最终得到 Hailuo 02 背后的核心架构 ——Noise-aware Compute Redistribution(NCR)。更具体一点,这个新架构的核心思路如下:

MiniMax 表示,在同等的参数量级下,新架构使其训练和推理效率提升了 2.5 倍。从而在不增加创作者使用成本的情况下,采用更大的参数规模,从而让模型有更好的表现力;又考虑到一定的推理优化的空间。最终把模型的总参数量扩大到了上一版模型的 3 倍。

更大的总参数量和更高的训练效率意味着我们可以拟合更多的数据,最终 MiniMax 把数据量扩大到了上一版的 4 倍,同时数据的质量和多样性也显著提高。

MiniMax 表示,新模型可以完整响应一些相当复杂的指令,让仔细编写的 prompt 得到更好的反馈。另外,得益于高效的新架构,创作者甚至可以用相对实惠的价格生成原生的 1080p 视频。

开发人员在 Artificial Analysis Video Arena 上请用户测试了模型的一个早期版本,排名全球第二。

MiniMax 表示,目前 Hailuo 02 提供三个版本:768p-6s,768p-10s,和 1080p-6s。

得益于上述的架构创新,其价格不管是对比国内的大厂,还是海外的大厂以及创业公司都具有一定的优势。IT之家附官方价格对比图如下:

MiniMax 表示,Hailuo 02 是一个新的起点,接下来将继续在以下几个方面更快速更新:

  • 生成速度提升

  • 更好的偏好对齐,抽卡率 / 稳定性提高

  • T2V / I2V 之外的高阶功能的实现

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!