AI热点 6月前 174 阅读 0 评论

OpenAI 升级开发工具:从 TypeScript 到语音优化,加速 AI 智能体落地

作者头像

AI技术专栏作家 | 发布了 246 篇文章

IT之家 6 月 4 日消息,OpenAI 公司昨日(6 月 3 日)发布博文,宣布升级旗下的 AI 智能体开发工具,在提升平台兼容性、优化语音界面支持之外,还增强了可观测性(observability)。

1.TypeScript 支持扩展开发者生态

OpenAI 宣布其 Agents SDK 新增 TypeScript 支持,继 Python 版本后,进一步覆盖 JavaScript 和 Node.js 环境开发者。

IT之家注:这一版本与 Python 版功能对齐,包含 Handoffs(任务转交机制)、Guardrails(运行时行为约束)和 Tracing(执行追踪)等核心组件。

此外,MCP(模型上下文协议)确保智能体步骤间上下文传递顺畅。TypeScript SDK 适配现代 Web 和云原生应用栈,开发者可在前端浏览器和后端 Node.js 环境中统一构建智能体。

2. RealtimeAgent 助力语音应用与人工干预

为支持低延迟语音应用,OpenAI 推出 RealtimeAgent 新功能,扩展 Agents SDK,集成音频输入输出、状态交互及中断处理。

该功能亮点在于“人机回路”(HITL)审批机制,支持开发者在 Runtime 暂停智能体执行,检查状态并手动确认后继续,这对需要监管、合规检查或领域验证的应用尤为重要。开发者可完整保留上下文并恢复执行。

3. 语音会话追踪

OpenAI 还升级了 Traces 仪表盘,支持 Realtime API 会话追踪,覆盖音频输入输出、工具调用及用户中断等环节,提供统一的审计记录,简化调试与性能优化。

4. 改进语音对语音模型

OpenAI 还改进语音对语音模型,重点降低延迟、提升对话自然性及中断处理能力,包括更快的流式响应、更具表现力的音频生成及对重叠输入的稳健应对,这些更新助力构建动态多模态对话智能体。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!