AI Agent 记忆的机会与挑战



OpenAI 宣布全面启用 ChatGPT 的记忆能力( ChatGPT 可以跨会话来根据记忆提供上下文。

记忆带来的机会

记忆功能无疑是增加 AI 应用粘性的一个重要方式。用户切换 AI 平台本来没有太大切换成本,但有了记忆后就不一样了。比如 Nuwa 的设计我就是和 ChatGPT 聊出来的,如果要聊 AI Agent 相关的东西,我都会倾向于和 ChatGPT 聊,不用我增加太多上下文,它就能理解 Nuwa 上的 AI Agent 能做什么,是如何工作的。

所以记忆功能会是后面所有 AI 应用发力的重要方向,包括 AI Agent。既然大家背后都调用的是大模型接口,差距主要出现在两个方面:

1. 工具集 tools:AI Agent 是否可以依赖 tools 做更多的事情。
2. 记忆能力:AI Agent 是否更懂你。

如何管理记忆?

AI Agent 的记忆应该如何管理?把和它所有的回话内容都作为记忆,是一种简单粗暴的方案。更好的方式是让 AI 来管理自己的记忆。Langchain 前一段时间推出的 langmem SDK 就是这个思路,给 AI 一组 tools 来管理记忆,由 AI 来决定什么应该记录下来。

Nuwa 设计的时候也是这个思路,提供了一组记忆的 Action:add/update/remove/compact。每次交互,AI 可以调用对应的 Action 来维护自己的记忆。大多数场景下,它也能工作,比如一个给用户分发测试币的 Agent,限制每个用户每天只能领一次,它会通过记忆来保存领取记录。

这种记忆的工作方式大体上是一种自动对回话的分析、评估和总结,和真正的人类的记忆方式还是有差距。

AI 真的理解“记忆”吗?

简单的一个测试用例是和 AI 玩猜数字游戏,让它想一个数字,然后你来猜。实际上 AI 并没有真正“想”一个数字,然后让你来猜,而是骗你和它交互几次后假装你猜对了,因为它并没有地方保存“想”的内容。而给它记忆工具后,我设想它会用记忆工具来保存“想”了但不说出来的内容,但实际上 AI 并没有自然理解“想”和记忆之间的关系。除非你明确告诉它,“请想一个数字,并用记忆工具保存下来”,否则它还是在瞎编。

这个例子看起来简单,但其实暴露了一个关键问题:AI 在当前阶段并不能自然地把“内部思考”和“记忆”建立连接。它对“记忆”的使用,更多是响应指令而非主动演化。

多人交互下的记忆挑战

更大的挑战出现在把 AI Agent 放在社交环境中。让它和多个人交互时,该怎么管理记忆?

如果 AI Agent 的记忆只是跨某一个人的多个会话,上面的机制大致可用。但如果它在一个社交网络中存在、与多个不同的用户互动,会遇到两个典型问题:

1. 记忆的存储与隔离问题:如果把所有人的交互内容全都记下来,每次交互都要加载,容易导致上下文爆炸。
2. 共享记忆的判定问题:什么样的信息需要被跨主体共享?什么又是应该保留在“对某个用户”的记忆中?这是当前的 AI 很难做出判断的。

Nuwa 的设计里,是按 Agent 交互对象的地址做隔离,在 Agent 自己地址的记忆中保存跨主体的共享内容。但这种机制需要 AI 自己意识到“这个信息是共享的”,实践结果看来,AI 的表现比较差。

举个例子:我给 AI Agent 转了一笔 Coin,告诉它,“当另一个用户 xxx 来和你交流时,顺便转给他。” 这是个很典型的共享记忆。但 AI 并不理解这个信息是它自己的一个“承诺”,需要保存成共享记忆,未来使用。

记忆的风险与未来方向

AI Agent 的记忆能力还有很大的发展空间。一方面来自 Agent 开发者对提示词和工具的不断打磨,另一方面也依赖模型本身的进化。特别是:

1. 记忆的归因能力:AI 是否能够理解某段信息是“我对某人的承诺”还是“某人的请求”还是“我曾经的推测”?现在这类“语义归因”还很薄弱。
2. 记忆与预测的关系:好的记忆不仅是回顾,更是一种前瞻能力。哪些信息未来可能会被用到,这其实是一种对未来的推理。

记忆与状态

AI Agent 的记忆能力,还有很长的路要走。它不是单纯的存储问题,而是认知结构的问题——它需要理解什么该记住、记到哪里、什么时候该忘记。

其实可以换个角度来看这个问题。如果我们把 Prompt 理解为“规则”,把记忆理解为“状态”,那 AI Agent 的整个行为过程,本质上就是一个有状态的推理系统。

从这个视角出发,记忆接口就不应该只是“记录对话”的简单能力,而应该支持一组结构化的状态类型。比如:

1. 用户偏好这样的 Key-Value 状态
2. 历史交互这样的时间序列
3. 对象状态的 Map 结构
4. 甚至更复杂的图结构,来表达社交关系、任务依赖或因果链条

总结

这个方向无论是从产品、算法,还是系统设计角度看,都是一个正在快速演化、充满机会的前沿领域。
AGENT-13.6%
PROMPT2.37%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)