AI热点 4小时前 115 阅读 0 评论

可灵2.5 Turbo太凶残:30%成本暴降+效果飞跃,生成体操动作可参赛

作者头像
量子位

AI技术专栏作家 | 发布了 246 篇文章

衡宇 发自 凹非寺

量子位 | 公众号 QbitAI

刚刚,快手可灵AI基座模型再升级,推出可灵2.5 Turbo视频生成模型。

AI视频玩家抹一把老泪,终于有AI视频模型让运动员们拥有不鬼畜自由了

a16z合伙人在上分享了一个可灵2.5 Turbo生成的视频:

要知道,今年年初,AI视频们的水平还在让运动员们四肢不分、胳膊和腿随意转换。

就算来看国内最早一批能够比较好hold住体操动作生成的可灵2.1(今年5月发布)的效果——

对比能够感知到,新模型在力量感、滞空感和物理感知上,都有明显进步。

再来看可灵2.5 Turbo生成的跳马过程。

这位选手助跑和腾空姿势基础,落地姿势就很不基础。

(虽然这个落地姿势必然扣大分,但好歹胳膊是胳膊,腿是腿了)

吊环项目男子组表现如下:

不拘泥于体操,足球、篮球比赛的效果也还挺不错。

“天青色等烟雨”,可灵2.5 Turbo会生成啥?

就在昨晚,快手推出了可灵2.5 Turbo模型,同时更新文生视频、图生视频两大功能。

官方表明,效果提升主要集中在文本响应、动态效果、风格保持、美学效果等维度。

必须要给大家划重点——

高品质模式(1080p)下,可灵2.5 Turbo生成5秒长度的视频仅需25灵感值,相比2.1模型同档位便宜近30%,更具性价比。

文本响应

测试感知,可灵2.5 Turbo的文本响应主要做了两个方面的升级。

一方面是可以用简单(且比较抽象)的文案,生成相应的视频片段——

Prompt:天青色等烟雨,而我在等你。

另一方面是对包含复杂因果关系和时间序列的提示词理解能力有了提升——

Prompt:真实速度播放。狭小的浴室里只有一盏冷白灯,镜头对准主角的脸,他双手撑在洗手台上,水滴从下巴滴落。镜头缓慢推进,主角盯着镜中的自己,表情先是麻木,然后嘴角开始抽搐,呼吸急促,眼泪涌出。他忽然猛地用拳头砸碎镜子,镜头捕捉到碎片反射出无数个他痛苦的眼神,手掌渗出血,表情变成彻底的歇斯底里。

讲真,上面这张图里生成的男人,越看越有奥特曼的影子在身上……

动态效果

动态效果方面,也有高速动态和大幅动态的效果升级,能够更好地学习和模拟真实世界的物理动态。

高速动态方面,先来看骑着自行车追着F1的第一视角镜头画面。

动漫风格下的高速动态和动作合理性也拿捏得不错:

大幅动态其实在开头的体育项目画面生成里展示得比较多了,这里放一个展示动态兼顾细节的画面,大家感知一下:

人物情感

有一点感知想和大家分享,那就是可灵2.5 Turbo对真人情感的捕捉更精细了。

不仅能够扛住特写镜头,而且尝试了好几个,都既没有明显假人感,也没有恐怖谷效应。

比如这个癫狂小丑:

以及预告片里的流泪和惊慌:

我们实测的结果,几乎roll 1-2遍就能出比较理想的效果,于是又去各个社交平台逛了一圈看看大家的用户体验。

有人惊呼惊艳,化身抽卡狂魔:

我不在乎是否需要100次生成才能获得1次电影级生成。
我唯一要说的就是它让我感到震撼。太棒了!

但也有人表示,在物理认知方面,可灵2.5 Turbo仍有欠缺:

官网显示,可灵AI团队构建了10余种场景任务,邀请第三方人士将可灵2.5 Turbo和Veo3-fast、Seedance 1.0、Seedance 1.0 mini进行了效果对比评测。

结果如下:

可灵已迭代超30次

据统计,可灵2.5 Turbo是今年以来快手可灵AI的第三次基座模型更新:

  • 4月15日,推出可灵2.0,首次展现出多模态编辑的能力;
  • 5月29日,推出可灵2.1,进一步强化对复杂指令的理解力;
  • 9月23日,推出可灵2.5 Turbo,更具性价比的同时提升效果。

高频更新似乎是可灵的一种常态。

在上个月底的快手光合大会上,快手披露一组数据:

可灵AI目前在全球拥有超过4500万创作者,产品自发布以来迭代升级30余次,累计生成超2亿个视频和4亿张图片。

此外,在市场格局层面,根据Poe在2025年初发布的使用趋势报告,可灵系列模型每次更新发布后,都会在极短时间内迅速占据大量市场份额。

例如4月底发布后三周内,Kling-2.0-Master就占据了Poe所有视频生成请求的21%,整个可灵系列的市场份额则达到了约30%。

相伴随的就是老牌AI视频生成工具的份额下降——譬如Runway,其使用份额在同期从约60%大幅下降至约20%。

现在可灵2.5 Turbo不仅能力升级,还具有更优性价比,感觉会在接下来迅速抢占一波市场了(盯ing)

截至发稿,新模型已经能在可灵网页端使用,iOS端暂未发现更新。

欢迎大家分享生成效果~

参考链接:
[1]https://www.youtube.com/watch?v=ZqxP616nvIE
[2]https://x.com/venturetwins/status/1970563820478439546

— 完 —

量子位 QbitAI · 头条号

关注我们,第一时间获知前沿科技动态

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!