开源项目 1天前 92 阅读 0 评论

阿里开源Qwen3-Next预览版!长上下文推理吞吐提升10倍!

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

Qwen团队近日发布了Qwen3-Next架构的预览版:Qwen3.5的抢先预览,并率先开源了基础模型Qwen3-Next-80B-A3B-Base。

这一80B参数模型在训练成本和推理效率上实现重大突破:训练资源消耗仅为Qwen3-32B的十分之一,而长上下文推理吞吐量可达后者的十倍以上。

实测表现

案例1:AIME数学竞赛题

模型就开始飞快地列出了详细解题思路和计算过程,最终得到的答案“588”与AIME标准答案完全吻合。

案例2:用p5js创建一个可直接玩的扫雷游戏。

案例3:生成天气卡片。

性能表现

预填充阶段 (Prefill): 在4K上下文下吞吐接近Qwen3-32B的7倍;在超过32K的长上下文下,吞吐提升超过10倍。

解码阶段 (Decode): 在4K上下文下吞吐提升约4倍;在长上下文(32K+)场景中,吞吐优势仍可保持超过10倍。

Qwen3-Next-80B-A3B-Base在多项基准测试中也展现了强大的实力:

在测试中超过了闭源模型Gemini-2.5-Flash-Thinking,并在部分指标上接近Qwen最新的旗舰模型
Qwen3-235B-A22B-Thinking-2507。

Qwen3-Next-80B-A3B-Base的发布标志着大模型在效率和性能上的一次重大突破。它以十分之一的训练成本,实现了对前代标杆模型的超越,并在长上下文推理吞吐上实现了数量级的提升。

开源地址:
https://huggingface.co/Qwen/Qwen3-Next-80B-A3B-Instruct

#AI开源项目推荐##github##AI技术##AI推理模型##阿里开源#

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!