AI热点 4小时前 55 阅读 0 评论

让 AI 真正“能做研究”,阿里通义 DeepResearch 模型、框架、方案全开源

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

IT之家 9 月 17 日消息,阿里通义实验室今日宣布,为了让 AI 真正具备“做研究”的能力,针对通义 DeepResearch 的数据、Agent 范式、训练、基础设施(Infra)、Test Time Scaling 进行了系统性创新,并宣布所有技术方案均已开源

根据介绍,通义 DeepResearch“不是简单的资料堆叠”,而是围绕一个问题完成一个完整的“研究闭环”,通过深度搜寻-多源交叉-结构化归纳-报告生成来产出有引用、可复现的调研报告与决策建议。

在 Humanity"s Last Exam、BrowseComp、GAIA、xbench-DeepSearch、WebWalkerQA 五个权威 Benchmark 上,通义 DeepResearch Agent 30B-A3B 轻量级达到了 SOTA 效果。官方表示,团队对深度研究型智能体的推理范式进行了广泛的探索,因此最终模型支持多种推理形式,包括原生的 ReAct 模式和上下文管理的深度模式。

目前,通义 DeepResearch 已经赋能多个阿里巴巴内部应用,真实落地案例包括高德地图、通义法睿两款应用。

通义 DeepResearch 与高德地图深度共建,联合推出全球首个 AI 原生出行 Agent。

该 Agent 为高德预置了专属地图 API、实时天气查询、交通状况监测等工具,可结合当下情况为用户提供更准确的行动建议。例如,在即将晚高峰的时候导航去机场,高德地图可制定绕开一条避开拥堵路线的方案。

在对专业性、准确性要求极高的法律领域,通义 DeepResearch 同样表现出色。我们将其能力注入“通义法睿”,打造了专为法律研究优化的智能体。它能自动检索法条、类案和裁判文书,并进行深度归纳分析。在与 OpenAI、Claude 等国际顶尖模型的同台竞技中,通义法睿在“法条引用相关性”和“案例引用相关性”两项关键指标上全面领先,综合表现最优。这不仅验证了通义大模型在复杂推理场景的硬实力,更为法律从业者提供了强大的生产力工具。

IT之家附开源地址:

  • GitHub:https://tongyi-agent.github.io

  • Hugging Face:https://huggingface.co/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B

  • 魔搭:https://modelscope.cn/models/iic/Tongyi-DeepResearch-30B-A3B

  • 博客:https://tongyi-agent.github.io/blog/introducing-tongyi-deep-research/

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!