AI热点 3小时前 60 阅读 0 评论

Dify:Memory Engineering 如何与人类认知对齐|QCon 上海

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


Dify 架构师周宇已确认出席并发表题为Dify:Memory Engineering 如何与人类认知对齐的主题分享。 Agent 的 Memory 问题一直都是 Agentic AI 的路上无法避免的话题,但是主流解决方案都在尝试用封闭域的解决方案解决开放域的问题,往往会导致人与 Agent 的上下文鸿沟,Agent 不知道什么是重要的,什么是用户需要的,什么是应该疑问的,Dify 将使用一套合理的产品设计来保持人与 Agent 的对齐。


周宇,Dify Agent / Sandbox / Plugin / Memory 架构师,Dify 第一版 Agent 工程师,设计了全套 Dify 插件机制,负责 Sandbox 与 Dify 系统安全设计。她在本次会议的详细演讲内容如下:


演讲提纲

几乎所有熟悉 LLM 的人都会碰到下面这些很麻烦的问题:

  • N 轮对话过后模型记不得自己说了什么,忘了用户要求过什么。

  • 一个任务模型执行了一次失败了结果两分钟过去它又跑一次,始终跑不对。

一切的问题根源来自于 Transformer 最开始无状态的设计:

  • 全量的、事无巨细的一切内容都被保留,从而便于模型玩成语接龙

  • 没有一个和 Messages 分离的 状态 可以保存高度浓缩的精华,就算有也难以修改

但是什么是重要的?什么是可以被丢弃的?什么时候又该更新记忆?似乎太过于主观:

  • 模型自身本来就存在于人类意志不对齐的情况

  • 人与人之前的信息不对齐也是常态,这在管理学中是一个复杂的系统工程

如果将一切的判断交给模型,难免会出现用封闭域的解决方案去套开放域的问题这类通用方案的旧病,模型是服务于人类的,需要时刻与人类保持意见对其,因此,需要有一种方案可以让用户决定这些背后的细节。


设计理念

  • 选择交给用户,不要将过多的未知数留给模型,避免去解决开放域的问题

  • 需求驱动,在用户不使用帮助文档的情况下可以理解,带着需求来就可以理解每个每个细节的作用


您认为,这样的技术在实践过程中有哪些痛点?

  • 会给用户带来一定的心智负担,任何任务的复杂性都不会消失只会转移,但人类应该明确自己的需求,并时刻保持与模型的上下文的对齐


演讲亮点

  • 避免了使用封闭域的解决方案解决开放域的问题

  • 高度保持与用户的认知对齐


听众收益

  • 了解当前行业内的 Memory 进展

  • 了解 Dify 在 Memory 的未来方向

  • 认识到 Memory 背后不可忽视的工程复杂度与设计哲学


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,,详情可联系票务经理 18514549229 咨询。

<!---->


作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!