AI热点 4月前 86 阅读 0 评论

2025 AI Agent 发展现状与六大趋势

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章


近半年,Agentic AI 创新步伐明显加快。更强的自主决策、更丰富的多模态融合,以及与外部系统的深度协作,正推动产品加速落地与商业化。


2025 年的市场格局已有所显现,以下是近期观察到的几大关键趋势。


1. Agentic RAG


简单定义:在传统 RAG(检索增强生成)基础上,引入 Agent 机制,让检索与生成过程变得更自主、更可控、更具多轮决策能力



图片来源:LangChain


目前应用场景:


- 构建基于推理的实时数据检索与生成型 AI Agent 工作流。


- Agentic RAG 的应用场景不限于单一领域,在医疗健康等行业同样具备潜力。


- Perplexity、Harvey AI、Glean AI 等公司正在采用。


2. Voice Agents


简单定义:Voice Agent 是指基于语音交互的人机智能体系统,结合 ASR、NLU、任务规划与执行以及 TTS 技术,实现从语音输入到任务完成再到语音输出的全链路闭环。



语音到语音(实时)架构,来源:OpenAI



链式架构,来源:OpenAI


往期内容:2025 最新 AI Voice Agent 研究与图谱


目前应用场景:


- 利用广泛的 TTS 和 ASR 嵌入和检索,通过自然口语与用户交互的 Agent。


- ElevenLabs、Cognigy、Vapi 和 Deepgram 等公司在采用。


3. AI Agent Protocols


简单定义:一般是指用于不同 AI Agent 之间,或 Agent 与外部系统之间通信、协作、共享信息的一套标准化规则与接口规范



来源:IBM


目前应用场景:


- 简化多智能体系统通信,支持不同框架中构建的 Agent 之间的通信。


- 被埃森哲等公司采用,协议包括 A2A、ACP、SLIM 等。


4. CUA(Computer Using Agents)


简单定义:CUA 可以真正使用计算机——启动应用程序、浏览网站以及推理执行任务。



来源:OpenAI


目前应用场景:


- Agent 可以像人类一样利用浏览器、CLI 甚至鼠标光标等工具与计算机进行交互。


- 被 OpenAI 等公司用作其 Operator、Claude"s Computer Use、H-Company 的 Runner H 和 Manus AI 等公司使用。


5. Coding Agents


简单定义:专门用于编写、调试、优化或管理代码的 Agent。它不仅能生成代码,还能理解代码上下文、执行多轮推理和调用外部工具,帮助开发者更高效地完成软件开发任务。



来源:付费 SubStack 专栏


目前应用场景:


- 借助使用的工具和基于 LLM 的代码生成,Multi-Agent 可以以 10 倍的速度构建和调试应用程序。


- 被 Windsurf、Cursor 和 GitHub Copilot 等公司使用。


- 最赚钱的几家 Agent 公司中,其中 Coding 占了大多数。


2025 AI Agent 发展现状与六大趋势


6. DeepResearch Agents


简单介绍:专注于科研与知识探索的 Agent,它们能够自动检索文献、分析数据、生成报告,并在多轮交互中推进研究任务。


- 协作 Multi-Agent 系统,从大量来源构建经过广泛研究的报告。


- 热门产品包括 Gemini DR、OpenAI DR 等。


文章来自于微信公众号“特工宇宙”,作者是“宇宙编辑部”。


作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!