AI热点 2月前 152 阅读 0 评论

刚刚,谷歌深夜上新Veo 3.1!网友狂刷2.75亿条,Sora 2要小心了

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

谷歌凌晨更新Veo 3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控,接入Gemini API与Vertex AI,Flow与Gemini可用。可合成多人物场景、音画同步,片段最长约148秒;规格至1080p/24fps。


刚刚,谷歌在今天凌晨更新了旗舰视频生成模型Veo 3.1



此次更新主要有两大功能亮点:


  • 更强的叙事与音频控制


  • 更丰富的输入与编辑能力



这次升级让AI对想讲述的故事能有更深的理解


Veo 3.1让AI视频生成迈入「导演级」精控阶段


真实与叙事感升级,更高画质与音画同步,让视频更具电影质感。


Veo 3.1目前已接入Gemini APIVertex AI


普通用户也可以直接在Flow或者Gemini中体验。


Flow使用方式如下,新建项目后即可使用。



Gemini可选择创建Video,即可使用Veo 3.1。



我们使用「威尔斯吃面」极简提示词测试了一下效果,确实已经非常流畅和自然。



对于首尾帧生成,我们也进行了测试,提示词为「奥特曼最后像钢铁侠一样飞走」。



效果也非常好。



Veo 3.1可以将不同人物和物体的照片合成一个完整的场景,并配有声音。



还能创建更长的片段,甚至持续一分钟或更久,延续原始镜头中的动作。


每个生成的视频都基于前一个片段的最后一秒,以帮助延续故事,并保持背景和人物的一致性。



只需提供第一帧和最后一帧,Veo就会让整个场景栩栩如生,创建带有宏大转场的无缝视频。


强推使用Flow来使用和体验Veo 3.1!


5个月前,谷歌正式推出Flow,一款由Veo驱动的AI电影制作工具。



目前,谷歌宣称用户已在Flow中生成了超过2.75亿个视频


此次Veo 3.1的更新,推出了用于剪辑编辑的新功能和增强创意能力。


Flow还有一个Flow TV的功能,像一个电视台一样,可以不断地换台,观看其他用户生成的创意视频。



Flow TV工作台可以通过工作台进行切换。



Flow将2.5亿个视频,分成了不同的频道。


比如碰撞测试、打招呼、感到可爱。。。等等。



而Short Films则是用户制作的微电影,制作更加精良,时间更长。


目前只放出了3部。



比如下面这部名为「FreeLancers」,讲述了这样一个故事:


在纽约一家秘密餐厅的晚餐中,两位久疏音信的养兄弟——一位做事谨慎、另一位喧闹且卤莽——回忆起他们作为国际杀手的职业生涯,直到他们意识到两人竟被雇佣去执行同一项任务:对方。



「FreeLancers」电影级别视频如下,电影质感非常高。

Veo 3.1技术规格上支持输出720p或1080p分辨率的视频,帧率为24帧/秒(fps)。


视频时长可选4秒、6秒或8秒,若使用Extend功能,视频最长可扩展至148秒。


各位觉得Veo 3.1的效果能不能打过Sora 2呢?


这次的Veo 3.1更像「功能小升级」——新增首尾帧、多图参考等控制。


但成片质感较Veo 3进步有限,甚至略微显得有点「假」。


原生时长仍只有8秒,Flow延长至30秒画面偶有衔接,音频提升其实很一般。


基础物理表现比过去好些,但一遇到人物表演与复杂调度还是会露馅。


但这个只是Veo 3->Veo 3.1的一次微调。


期待一下谷歌年底的大招,估计会配合Gemini 3全家桶发布。


参考资料:


https://x.com/GoogleDeepMind/status/1978491999029219364


文章来自于微信公众号“新智元”。


作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!