AI热点 4月前 • 127 阅读 • 0 评论

代季峰陈天桥联手AGI首秀炸场！最强开源深度研究模型，GAIA测试82.4分超OpenAI

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

HuggingFace

HuggingFace

0秒前

白交发自凹非寺量子位 | 公众号 QbitAI

最强开源深度研究模型来了。

MiroMind ODR（Open Deep Research），来自代季峰加盟陈天桥的技术首秀。

首先，它做到了性能最强，GAIA测试结果更是达到了82.4分，超过了一众开源闭源模型，其中包括Manus、OpenAI的DeepResearch。

其次，它是真·全开源可复现，它的核心模型、数据、训练流程、AI Infra、DR Agent框架统统开源。

而据代季峰的朋友圈透露，他们将保持每月一次开源的更新速度。而这个项目是他们团队经过一个季度的努力而实现的。

从他们提供的演示来看，似乎都是在手机端上进行，因此不排除之后他们在手机端部署的可能性。

目前，他们还开放了Demo可以体验。

最强开源深度研究模型

在Demo体验区有这样一句介绍，我们不提供AI（我们只是AI的搬运工），我们与您共同构建它。

好好好，说回到这个项目体验，目前它还属于比较早期，仅支持单轮次、且英文的对话输入。

随便选一个推荐问题上去，能够看到，它的思考过程和最终结果有很明显的分区。

思考过程左侧还有工作流的导览指引，你可以选择指定的节点进行查看。

过程中能够看到它支持联网搜索的。

最后的结果呈现得也比较清晰。

与现有的深度研究方法相比，MiroMind ODR项目开放了深度研究的各个阶段，包括四个子项目：

MiroFlow（Agent框架）、MiroThinker（模型）、MiroVerse（数据）和MiroTrain（训练基础设施）。

MiroFlow，支持多种主流工具调用，扩展大语言模型，支持工具辅助的深度研究推理。它的亮点在于可以稳定复现最强性能，也就是GAIA上82.4的成绩。

MiroThinker，原生支持工具辅助推理的大语言模型，可训练、可复现，在 GAIA 中表现最佳。

此外，它在GAIA-Text-103上取得了SOTA性能（60.2%），接近 OpenAI Deep Research。

MiroVerse，147K开源训练数据支持深度研究训练。此外团队还会关注社区反馈，每月持续提供高质量、深入的研究数据集。

MiroTrain，支持深度研究模型的稳定高效训练，覆盖整个Deep Research训练流程，支持长文本训练和RL训练工具。

不过除了这个项目之外，在GitHub上还看到了他们几周之前的成果MiroMind-M1。

MiroMind-M1是一系列基于Qwen-2.5 完全开源推理语言模型，专注于提升数学推理能力。

该模型通过监督式微调（SFT）在 719K 个精心筛选的问题集上进行训练，并采用可验证奖励的强化学习（RLVR）在 62K 个具有挑战性的示例上进行优化，使用了基于上下文的多阶段策略优化方法（CAMPO）。

在AIME24、AIME25和MATH500上，在基于7B Qwen-2.5的开源模型中取得了最佳性能。

代季峰加盟盛大后首秀

这个项目中的核心人物，自然是代季峰这位大牛。

个人网站上依旧显示其清华大学电子工程系副教授岗位。

公开信息显示，代季峰在计算机视觉、深度学习领域发表国际期刊、会议文章80余篇，论文总引用6万余次。

他是R-FCN物体检测算法和Deformable ConvNets的作者。R-FCN被评价为“三大目标检测元模型之一”；而研发的Deformable ConvNets，性能超越微软、Meta、谷歌等机构的视觉大模型

他主导开发的InternVL多模态基础模型，是最具影响力的开源多模态基础模型之一，被广泛应用于工业界和学术界，Hugging Face下载量超过1千万次。

2009年和2014年于清华大学自动化系分别获得工学学士和博士学位。

随后微软亚洲研究院视觉组工作，担任首席研究员、研究经理。

2019年来到商汤的研究院工作，担任执行研究总监。直到2022年选择回归学界担任副教授。

这次选择再次出山，是为AGI而来。

据科创板日报消息，他加盟陈天桥旗下的盛大网络，正筹备一家新的AI创业公司，目标是打造第二个DeepSeek，将围绕AGI展开基础性研究。

这个公司有三个研发重点：AI商业决策智能化、突破算法茧房的内容分发，以及面向老龄化和青年发展的AI服务。

不过从MiroMind官网上也能看到出一些端倪，他们的使命是我们正在打造具备自我意识的数字生命体，与社区共同进化，以实现安全、有益的AGI惠及所有人。

所以，此次MiroMind ODR既是MiroMind的正式亮相，同样也是代季峰面向AGI的技术首秀。

Blog: https://miromind.ai/blog/miromind-open-deep-researchDemo: https://dr.miromind.ai/GitHub: https://github.com/MiroMindAIHugging Face: https://huggingface.co/miromind-ai

本文来自微信公众号“量子位”，作者：关注前沿科技，36氪经授权发布。

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

1月前 • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

发布即开放：百度猎户座葫芦里卖的什么药？

发布即开放：百度猎户座葫芦里卖的什么药？

1月前 • AI热点

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

1月前 • AI热点

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

1月前 • AI热点

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

1月前 • AI热点

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

1月前 • AI热点

小鹏物理AI的尽头，是马斯克的现金流

小鹏物理AI的尽头，是马斯克的现金流

1月前 • AI热点

热门标签

违规小程序腾杨赛评 API服务内容创业小米科技超级智能文物识别 Seedance 1.0 pro 全球移动发行商收入核心素养

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝