AI热点 7小时前 123 阅读 0 评论

即梦VS可灵,谁能「对标」Sora2?

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

AI视频的战争,才刚刚开始。 

在生成式AI的大航海时代,文字、图像、代码的疆界已相继被重绘,唯独“视频”这一最复杂、最昂贵、最具传播势能的内容形态,始终处在被技术反复叩门却未彻底攻陷的高地。 

这个局面,似乎终于要被OpenAI在10月1日推出的Sora2而改变。 

图源:网络

如果说今年早些时候的Sora只是一次“从文本到视频”的早期演示,那么 Sora2则更像是一次内容范式的重塑: 它不仅能生成物理一致性更强、镜头语言更成熟的动态画面,还在音画同步、环境声效、人物对白等方面实现了重大突破——AI不再只是“画面导演”,而是第一次同时担任了摄影师、编剧、配乐师和演员。

与此同时,OpenAI还选择将它打包成一个社交平台级产品——Sora App,而不只是模型本身:创作者可以一键生成视频、上传人像 cameo、Remix他人作品,甚至像刷TikTok一样在流里发现AI内容。 

Sora App

这也是为何,长期对视频生成持谨慎态度的知名分析师Ben Thompson 态度大变,称之为“一个可能撼动Meta和Tiktok社交帝国根基的威胁” —— Sora不再是技术的展示,而是内容分发逻辑的重塑。

当AI不仅能生成视频,还能决定“视频如何被观看”“创作者如何被推荐”时,整个内容平台的生态规则都可能被重写。

面对这股浪潮,中国的科技巨头们自然不会坐视不理。字节跳动的即梦和快手的可灵作为AI文生视频工具也已存在多时,并在国内用户增长和产品功能上迅速迭代 , 正因如此,当 Sora 2引爆话题之时,社交媒体上也传出了大厂国庆连续加班研究的消息。 

Sora2 生成视频

于今其所要面对的问题是, 在Sora2已经将“AI生成视频工具”升级为“AI内容平台”的今天,谁能最先在国产赛道上拿出可对标的产品? 或许这一次的战略性“对标”,反而能够为其始终未能找到出路的AI内容真正解套。 

01 从模型到平台:Sora2为何成为“现象级产品”

要理解Sora2所引起的轰动效应,必须先认识到它带来的,其实并非单纯意义上“视频生成能力”的升级,反而是长久以来对于“AIGC内容”叙事范式的再定义。 

首先,Sora2在内容生产的维度上实现了质变。

它最大的突破在于“音画同步”和“物理一致性”的双重跃迁:视频中的光影、重力、碰撞、镜头语言都比前代自然得多,甚至连人物对话、背景音效、情绪氛围都可以自动生成。 

Sora2 生成视频

这意味着AI第一次具备了“编导级”的综合叙事能力—— 不仅能“画出”一个世界,还能“让这个世界活起来”。 在传统影视行业,这相当于从一支美术团队变成了一个完整的制作公司。 

其次,Sora2的产品形态本身更具战略意味。

OpenAI没有让它停留在“API模型”或“开发者工具”的层面, 而是直接推出了Sora App,一个具备创作、分发、互动、推荐等功能的“AI原生内容平台”。

这一决策背后是对未来互联网内容生态的深刻洞察:AI不只是生产力工具,更是平台竞争的新核心。当生成能力与分发逻辑绑定,创作者行为就会被平台设计重新塑造,生态壁垒也将因此建立。 

Sora App截图

接着,Sora2的“Cameo”功能进一步拉近了人与AI内容的距离。

用户只需上传一张人像或一段音频,AI就能在生成的视频中“代入”你的形象。“自我投射”的能力,使AI视频不再只是“看”的内容,而是“参与”的内容。 这是“用户创作行为的彻底重构”——它把创作门槛降到零,同时激活了人类最本能的表达欲望。

最后,也是最具产业级意义的一点:Sora2的社交属性使其从“工具”变成了“平台”。

它不再仅仅只是一个AI文生视频大模型,而是一个内容分发系统; 它 不只是为创作者服务的API,而是一个可能吸引数亿用户日活的短视频入口。 

Sora App发布后首周下载量

可以说正是这一架构使其对Meta和Tiktok产生了结构性威胁,因为它有潜力从根本上重塑短视频平台的竞争格局—— 当“视频生产”本身不再是人的专属能力,平台之间拼的就不再只是内容,而是“生成 + 分发”的一体化体验。

并且 ,  OpenAI可以毫无包袱的去做这件事,毕竟对他们来说,将更具娱乐消费属性的Sora与生产力属性更强的ChatGPT区隔开来,反而有助于两个平台各自的有效增长。 

02 追兵的机会与困局:即梦 vs 可灵

如果说OpenAI的Sora2为全球 AI 视频赛道树立了新的标杆,那么 , 在中国市场,最有机会追上的,显然是字节 跳动 的即梦 与快手的可灵。 

两者都已经迈出了第一步,但前路各有优势与短板。 

从基础能力看,即梦更像是“产品派”的代表。

它背靠字节的剪映、抖音生态,具备天然的分发入口和用户场景优势。即梦的Seaweed模型已经支持文本生成视频、动作模仿、多模态参考等功能,平台内还集成了创作、编辑、分享的完整生产链条。 

即梦AI制作的短片《权利童话》

字节的强项显然不在于最前沿的模型研发,更多还是依靠产品逻辑做成生态闭环:只要生成质量达到“可用”水平,就可以借助抖音的流量分发迅速起量。这也是为什么即梦虽然相对后发,却 同样 能够快速获得 大批 用户青睐。 

它的短板同样明显:目前的即梦在音画同步、物理细节、长时视频一致性上,仍与Sora2甚至是可灵存在着差距。更重要的是,抖音如此巨大的体量之下,除非是AI视频的确有什么巨大突破,否则很难说服大部分用户必须用即梦来做视频。 

可灵的路线则更偏“技术派”。

可灵AI生成视频截图

快手从一开始就强调模型层面的突破:在2.0版本中,可灵引入了多模态视觉语言(MVL)、多图参考、3D轨迹控制等技术模块,目标是逐步接近Sora2的生成质量。 

更重要的是,可灵已具备生成数分钟长视频和复杂镜头语言的能力,并开始探索“视频续写”“镜头编排”等更贴近影视制作的方向。从技术潜力来看,可灵也许比即梦更接近“对标产品”的目标。 

然而,快手需要面对的是生态问题:它的分发能力和创作者生态不如字节庞大,平台对用户生成内容的承载能力相对有限。换句话说,可灵或许能先跑出“模型层面的对标”,但未必能先跑出“产品层面的平台”。 

可灵AI单元故事集《新世界加载中》

然而, 真正制约这场竞争走向的,或许并不是技术,更多还是商业层面的考量。 国内AI文生视频目前最大的困境在于,依然没有找到真正的商业模式。 根据快手发布的2025年第二季度财报显示,可灵AI在该季度的营收达到了2.5亿元 , 较去年有了数倍增长, 然而,影响的 客户其实依然还是专业机构或是自媒体。 本质上来说,AI视频生产工具并不属于大众消费产品。

即便是过去一年被寄予厚望的“AI短剧”,也没有演化出一个足够有规模、有利润的生态系统。多数项目仍然依赖补贴或营销预算驱动,无法自我造血,用户的留存和付费意愿也远未验证。在这种背景下,如果让文生视频作为“功能模块”嵌入到抖音、快手等主平台之中,便很难成为业务增长的新支点。 

用户生成的AI短剧

更重要的是, 如果让抖音和快手本体直接承担AI视频生产的任务,不仅面临注意力被稀释、用户体验受影响的风险,也会引出复杂的伦理与法律问题 ——例如真人视频与AI视频的混杂如何标注、内容责任如何界定、算法推荐是否应区分来源等。 

正因如此, 从产品形态的角度来看,打造一个“只允许AIGC视频存在”的独立平台,不仅是未来竞争的方向,也可能是行业走向成熟的必要条件。

Sora2的出现,让“AI视频”从技术演示变成了行业主战场。它不只是重新定义了“内容怎么生产”,还在重塑内容如何被分发、创作者如何被激发、平台如何被重构。 

Sora2 生成视频

对于抖音和快手而言,压力同样来源于需要用AI产品来和自己原本的内容平台打擂台,这其实是OpenAI所不需要考虑的问题,毕竟它只是从零开始去颠覆,才能够如此不管不顾。

这倒是也是为什么按照国内产品“对标”的能力,原本以为加班一个国庆大概就应该已经有类似产品的1.0版本出现,但快两周过去,大家依然还是热火朝天的在讨论Sora2,却没见到两家大厂的跟进动作。 

理论上来看谁愿意先做出真正意义上的“国产Sora2”,其实也决定两家公司各自的AI战略走向,更重要的是在AI创作内容这个层面,“视频”始终还是皇冠上的明珠,无法在这一能力上占得一席之地,其实到头来也很难说把“AI故事”讲完整。 

本文来自微信公众号 “壹娱观察”(ID:yiyuguancha),作者:大娱乐家 ,36氪经授权发布。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!