开源项目 6月前 • 143 阅读 • 0 评论

阿里开源Qwen3-Next预览版！长上下文推理吞吐提升10倍！

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

Qwen团队近日发布了Qwen3-Next架构的预览版：Qwen3.5的抢先预览，并率先开源了基础模型Qwen3-Next-80B-A3B-Base。

这一80B参数模型在训练成本和推理效率上实现重大突破：训练资源消耗仅为Qwen3-32B的十分之一，而长上下文推理吞吐量可达后者的十倍以上。

实测表现

案例1:AIME数学竞赛题

模型就开始飞快地列出了详细解题思路和计算过程，最终得到的答案“588”与AIME标准答案完全吻合。

案例2：用p5js创建一个可直接玩的扫雷游戏。

案例3：生成天气卡片。

性能表现

预填充阶段 (Prefill)：在4K上下文下吞吐接近Qwen3-32B的7倍；在超过32K的长上下文下，吞吐提升超过10倍。

解码阶段 (Decode)：在4K上下文下吞吐提升约4倍；在长上下文（32K+）场景中，吞吐优势仍可保持超过10倍。

Qwen3-Next-80B-A3B-Base在多项基准测试中也展现了强大的实力：

在测试中超过了闭源模型Gemini-2.5-Flash-Thinking，并在部分指标上接近Qwen最新的旗舰模型
Qwen3-235B-A22B-Thinking-2507。

Qwen3-Next-80B-A3B-Base的发布标志着大模型在效率和性能上的一次重大突破。它以十分之一的训练成本，实现了对前代标杆模型的超越，并在长上下文推理吞吐上实现了数量级的提升。

开源地址：
https://huggingface.co/Qwen/Qwen3-Next-80B-A3B-Instruct

#AI开源项目推荐##github##AI技术##AI推理模型##阿里开源#

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

4月前 • 开源项目

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

4月前 • 开源项目

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

4月前 • 开源项目

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

4月前 • 开源项目

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • 开源项目

AI的开源战略

AI的开源战略

4月前 • 开源项目

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

4月前 • 开源项目

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

4月前 • 开源项目

热门标签

直播带货收入火爆小剧场过大年场景化模型匹配代码补全工具分享我的专业知识 3D视频通话 o3-deep-research-2025-06-26 阿里达摩院 Visa

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝