8 月 18 日,百度文库联合百度网盘发布全球首个全端通用智能体「GenFlow2.0」。据介绍,该产品支持超 100 个专家智能体同时干活,3 分钟并行完成超 5 项复杂任务,生成速度超主流同类型产品 10 倍,率先做到“分钟级交付、过程可干预、记忆可追溯”。
目前,GenFlow2.0 已经正式在百度文库 Web 端、APP 端上线,无需排队、邀请码,所有用户均可以直接使用。此前在今年 4 月,百度文库、百度网盘推出内容操作系统“沧舟 OS”,并基于此系统推出 GenFlow1.0,在短短 4 个月内,其能力得到巨大提升。
据悉,对于“描述难”问题,文库 GenFlow2.0 可自主理解用户意图并规划执行,自动切换简单对话、复杂任务等不同协作模式,同时,文库 GenFlow2.0 支持用户在任务过程随时“干预”,根据场景需求进行暂停、追问、修改思考内容、上传文件参考,让用户实现自由表达,端到端提供最佳交付结果。
针对“等待久”问题,与主流 Agent 串行工作流不同,文库 GenFlow2.0 采用自研 Multi-Agent 基础架构,实现分钟级「并行」工作和交付,APP 端更将常规“瀑布式”升级为“并列式”工作流,极大提升用户交互体验。
在“交付”能力上,文库 GenFlow2.0 可调用 100+多模态 Agent 组成的“AI 专家团”,并行生成 PPT、研报、视频绘本、海报、图片、图表、HTML、代码、游戏、网站等多模态内容,所有 Agent 均经过文库网盘数亿用户验证。比如,文库 PPT Agent 能力已达全球领先,用户访问量位列全球第一。研报 Agent 在行业率先实现数万字专业报告的分钟级生成,可同时生成专业级可视化图表。
文库 GenFlow2.0 还全面打通了百度生态资源。比如,用户授权后可以随时检索、调用百度网盘中存储的指定资料;在旅游攻略或地址检索任务中,可以调用百度地图工具;在学术研究类任务中,支持深度搜索全网,直接调用百度学术超 6.8 亿篇文献库及文库超 14 亿专业优质内容。
针对通用 Agent 生成内容“千篇一律”的通病,GenFlow2.0 可以记录并运用用户在文库网盘的历史沟通记录、上传下载文件等,通过分析用户的聊天记录、搜索偏好等,完整交付更懂用户的个性化内容。
GenFlow2.0 还自研了 AI 编辑器,用户在任务过程中可随时进行在线编辑,生成内容后还可导入到个人知识库,或导入到自由画布进行更加自由、便捷的编辑。
用户体验不断提升的背后,是文库网盘在技术基座上的投入。
据悉,在模型上,文库网盘自 AI 重构以来就坚持 MoE(底层专家模型),可基于不同任务、步骤来调用不同模型;在技术上,GenFlow2.0 自建 Multi-Agent 引擎,积极优化上下文工程,为模型构建信息生态系统,通过动态混合推理、多模式智能化调度、公私域知识增强以及全模态渲染编辑,实现对复杂任务的一站式端到端交付,以及构建包括全周期消息总线、多模态数据理解、临短长记忆中枢、多级风控体系等能力的强大基础底座,实现性能、效果和扩展性的最优解。
同时,GenFlow2.0 兼容 MCP 协议,可灵活接入第三方服务生态。基于文库网盘联合发布的内容操作系统沧舟 OS,率先将 MCP 用于产品与生态连接,通过 MCP Server 与 Agent to Agent 的形式,将文库与网盘能力全面开放,支持厂商、企业用户、智能体应用、开发者等,低成本、高效率接入,使更多用户享受更大容量、更高速度、更自由模态的内容存储、管理、搜索、总结、创作与分享服务。活动上,文库网盘宣布升级开发者权益,新开放和优化升级超 100 项能力,所有能力将提供免费额度。
根据介绍,荣耀作为全球首批接入 MCP 生态的硬件厂商,将 GenFlow 2.0 原生接入了荣耀智能助理 YOYO,实现 AI Agent 与硬件厂商的系统级原生调度。通过 MCP 生态与 GenFlow 2.0 智能体调度能力,荣耀 MagicOS 用户可一键获取个人网盘知识库与文库专业文档,获得网盘检索、内容分享、联网搜索、图片理解、文件总结与问答、文库 PPT 生成等优质体验,率先体验“全端通用、任务闭环”的 AI 能力,迈入“AI 原生智能×硬件原生协同”的新时代。
截至目前,百度文库拥有超 14 亿专业内容资源,AI 月活用户超 9700 万,拥有智能 PPT、智能文档、AI 绘本等数百项 AI 能力;百度网盘已累计服务超 10 亿用户,月活用户超 2 亿,AI 月活用户超 8000 万,已经成为 AI 时代的“超级生产力”。