最新一期权威大模型榜单：豆包1.5、商汤日日新V6并列国内第一

cnhcly

AI技术专栏作家 | 发布了 246 篇文章

5月28日，权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》全新出炉！

豆包1.5·深度思考模型（Doubao-1.5-thinking-pro）和商汤日日新 V6多模态模型（SenseNova-V6 Reasoner）共同摘得金牌，超越Gemini 2.5 Flash Preview，在国内大模型第一梯队领跑。

位居第二梯队的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。

来自SuperCLUE

报告指出，国内外第一梯队大模型在中文领域的通用能力差距正在缩小。在国产大模型中，
Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner表现最为亮眼。国内推理模型竞争格局初露端倪。

SuperCLUE是行业权威的通用大模型的综合性测评基准。本次2025年5月报告聚焦通用能力测评，涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本理解与创作六大任务，总量为1579道多轮简答题。

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

登录账号

最新一期权威大模型榜单：豆包1.5、商汤日日新V6并列国内第一

AI前线

评论 (128)

AI爱好者

开发者小明

AI前线作者

科技观察家

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

速抢（2核2G）77元/年香港免备案服务器

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI前沿

机器学习实验室

AI创业圈

登录账号

最新一期权威大模型榜单：豆包1.5、商汤日日新V6并列国内第一

AI前线

评论 (128)

AI爱好者

开发者小明

AI前线 作者

科技观察家

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

速抢（2核2G）77元/年香港免备案服务器

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI前沿

机器学习实验室

AI创业圈

AI前线作者