AI热点 1月前 169 阅读 0 评论

豆包大模型1.6发布:全球第一梯队!可生成1080p高品质视频

作者头像
快科技

AI技术专栏作家 | 发布了 246 篇文章

快科技6月12日消息,字节跳动旗下豆包大模型正式升级为1.6版,在推理、数学、指令遵循、Agent等方面的能力均有较大提升,同时豆包视频生成模型Seedance 1.0 pro、豆包语音播客模型也正式发布。

豆包大模型1.6包括三部分,分别是豆包1.6、豆包1.6-thinking、豆包1.6-flash。

其中,豆包1.6支持on/off/auto三种思考模式,豆包1.6-thinking强化了思考能力,支持多模态,在多个权威测评集上达到了全球第一梯队水平。

比如,GPQA Diamond测试成绩达到81.5分,是目前最好的推理模型之一。

再比如,数学测评AIME25成绩达到86.3分,相比豆包1.5深度思考模型大幅提升12.3分。

豆包大模型1.6系列均支持深度思考、多模态理解、256K长上下文(首个)、图形界面操作等能力,能够更好地支持复杂Agent的构建,促进AI生产力的提升。

目前,豆包大模型1.6系列已在火山引擎上线,企业和开发者可调用API体验。

价格方面,按照百万tokens:

0-32k上下文,输入0.8元,输出为8元;

32-128k上下文,输入1.2元,输出16元;

128-256k上下文,输入2.4元,输出24元。

豆包视频生成模型Seedance 1.0 pro支持文字与图片输入,可生成多镜头无缝切换的1080p高品质视频,主体运动稳定性与画面自然度较高。

通过调研影视创作者等群体的实际需求,Seedance 1.0 pro不仅将指令遵循、运动稳定性、画面质量等行业共识性指标纳入攻坚方向,同时,也将多任务生成、1080p高清生成、快速视频生成等难题作为核心目标。

新版模型在动态图像生成的各维度上,有较好的综合表现,尤其动作生成、指令遵循等关键能力处于业界前列,推理速度、用户好评度等方面也比较突出。

根据国际知名评测榜单Artificial Analysis,Seedance 1.0 pro在文生视频、图生视频两个任务的表现均排名首位。

Artificial Analysis 文生视频榜单,数据截至 2025-06-09 11:00 (GMT 8)

Artificial Analysis 图生视频榜单,数据截至 2025-06-09 11:00 (GMT 8)

豆包语音播客模型源于端到端实时语音的进一步拓展,能够实现从文本创作到双人对话式播客作品的秒级生成,同时具备互相附和、插话、犹豫等自然的播客元素生成,达到了媲美真人的生成效果。

用户可以在扣子空间(https://space.coze.cn/)体验语音播客相关功能。

同时,豆包产品已启动小流量测试,近期将全量上线播客模型。

(举报)

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!