开源项目 5天前 166 阅读 0 评论

通义WebAgent 续作!WebShaper:开源且高效的信息检索智能体!

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

在AI智能体激烈角逐信息检索能力的今天,阿里巴巴通义实验室悄然开源WebShaper项目!

它不仅以60.1分的成绩登顶GAIA评测开源榜首位,更以颠覆性的形式化驱动范式,重新定义了高质量训练数据的合成逻辑。

并仅用5k高质量训练轨迹,WebShaper通过监督微调(SFT)与群组相对策略优化(GRPO)强化学习,在GAIA评测中超越所有开源方案。

核心创新:

传统IS任务训练数据依赖“信息驱动”合成范式(如WebDancer),通过预检索知识图谱生成问答对,存在知识结构与推理逻辑割裂、任务覆盖有限两大瓶颈。WebShaper首次提出基于集合论的IS任务形式化建模,将复杂问题转化为“知识投影(KP)”的集合操作(如R-并集、交集、递归),实现任务结构精准控制:

这一变革使数据合成具备全域任务覆盖、结构语义对齐、推理复杂度可控三大优势,彻底突破预检索数据边界。

智能体模块:

WebShaper通过Expander智能体模块实现数据自动化合成:

种子构建:基于Wikipedia词条随机游走生成基础任务;

KP表示:引入变量与常量符号化表示复杂逻辑;

逐层扩展:独创叶节点常量扩展策略,避免冗余信息与推理捷径;

验证闭环:调用搜索、摘要、验证工具确保任务正确性与逻辑严谨性。

应用场景:

WebShaper的高质量数据合成能力打开了广阔应用空间:

学术研究:自动整理跨学科文献,加速知识发现

市场分析:实时抓取行业数据,生成竞争策略报告

教育助手:构建多跳推理题库,培养批判性思维

医疗决策:整合最新医学指南提供个性化诊疗建议

WebShaper的突破远不止于技术指标,它更标志着AI智能体开发范式的根本转向。

GitHub:https://github.com/Alibaba-NLP/WebAgent

#AI开源项目推荐##github##AI技术##阿里通义#ai智能体##AI信息检索#

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!