AI热点 2小时前 98 阅读 0 评论

代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

白交 发自 凹非寺量子位 | 公众号 QbitAI

最强开源深度研究模型来了。

MiroMind ODR(Open Deep Research),来自代季峰加盟陈天桥的技术首秀。

首先,它做到了性能最强,GAIA测试结果更是达到了82.4分,超过了一众开源闭源模型,其中包括Manus、OpenAI的DeepResearch。

其次,它是真·全开源可复现,它的核心模型、数据、训练流程、AI Infra、DR Agent框架统统开源。

而据代季峰的朋友圈透露,他们将保持每月一次开源的更新速度。而这个项目是他们团队经过一个季度的努力而实现的。

从他们提供的演示来看,似乎都是在手机端上进行,因此不排除之后他们在手机端部署的可能性。

目前,他们还开放了Demo可以体验。

最强开源深度研究模型

在Demo体验区有这样一句介绍,我们不提供AI(我们只是AI的搬运工),我们与您共同构建它。

好好好,说回到这个项目体验,目前它还属于比较早期,仅支持单轮次、且英文的对话输入。

随便选一个推荐问题上去,能够看到,它的思考过程和最终结果有很明显的分区。

思考过程左侧还有工作流的导览指引,你可以选择指定的节点进行查看。

过程中能够看到它支持联网搜索的。

最后的结果呈现得也比较清晰。

与现有的深度研究方法相比,MiroMind ODR项目开放了深度研究的各个阶段,包括四个子项目:

MiroFlow(Agent框架)、MiroThinker(模型)、MiroVerse(数据)和MiroTrain(训练基础设施)。

MiroFlow,支持多种主流工具调用,扩展大语言模型,支持工具辅助的深度研究推理。它的亮点在于可以稳定复现最强性能,也就是GAIA上82.4的成绩。

MiroThinker,原生支持工具辅助推理的大语言模型,可训练、可复现,在 GAIA 中表现最佳。

此外,它在GAIA-Text-103上取得了SOTA性能(60.2%),接近 OpenAI Deep Research。

MiroVerse,147K开源训练数据支持深度研究训练。此外团队还会关注社区反馈,每月持续提供高质量、深入的研究数据集。

MiroTrain,支持深度研究模型的稳定高效训练,覆盖整个Deep Research训练流程,支持长文本训练和RL训练工具。

不过除了这个项目之外,在GitHub上还看到了他们几周之前的成果MiroMind-M1。

MiroMind-M1是一系列基于Qwen-2.5 完全开源推理语言模型,专注于提升数学推理能力。

该模型通过监督式微调(SFT)在 719K 个精心筛选的问题集上进行训练,并采用可验证奖励的强化学习(RLVR)在 62K 个具有挑战性的示例上进行优化,使用了基于上下文的多阶段策略优化方法(CAMPO)。

在AIME24、AIME25和MATH500上,在基于7B Qwen-2.5的开源模型中取得了最佳性能。

代季峰加盟盛大后首秀

这个项目中的核心人物,自然是代季峰这位大牛。

个人网站上依旧显示其清华大学电子工程系副教授岗位。

公开信息显示,代季峰在计算机视觉、深度学习领域发表国际期刊、会议文章80余篇,论文总引用6万余次。

他是R-FCN物体检测算法和Deformable ConvNets的作者。R-FCN被评价为“三大目标检测元模型之一”;而研发的Deformable ConvNets,性能超越微软、Meta、谷歌等机构的视觉大模型

他主导开发的InternVL多模态基础模型,是最具影响力的开源多模态基础模型之一,被广泛应用于工业界和学术界,Hugging Face下载量超过1千万次。

2009年和2014年于清华大学自动化系分别获得工学学士和博士学位。

随后微软亚洲研究院视觉组工作,担任首席研究员、研究经理。

2019年来到商汤的研究院工作,担任执行研究总监。直到2022年选择回归学界担任副教授。

这次选择再次出山,是为AGI而来。

据科创板日报消息,他加盟陈天桥旗下的盛大网络,正筹备一家新的AI创业公司,目标是打造第二个DeepSeek,将围绕AGI展开基础性研究。

这个公司有三个研发重点:AI商业决策智能化、突破算法茧房的内容分发,以及面向老龄化和青年发展的AI服务。

不过从MiroMind官网上也能看到出一些端倪,他们的使命是我们正在打造具备自我意识的数字生命体,与社区共同进化,以实现安全、有益的AGI惠及所有人。

所以,此次MiroMind ODR既是MiroMind的正式亮相,同样也是代季峰面向AGI的技术首秀。

Blog: https://miromind.ai/blog/miromind-open-deep-researchDemo: https://dr.miromind.ai/GitHub: https://github.com/MiroMindAIHugging Face: https://huggingface.co/miromind-ai

本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!