AI Agent 記憶的機會與挑戰



OpenAI 宣布全面啓用 ChatGPT 的記憶能力( ChatGPT 可以跨會話來根據記憶提供上下文。

記憶帶來的機會

記憶功能無疑是增加 AI 應用粘性的一個重要方式。用戶切換 AI 平台本來沒有太大切換成本,但有了記憶後就不一樣了。比如 Nuwa 的設計我就是和 ChatGPT 聊出來的,如果要聊 AI Agent 相關的東西,我都會傾向於和 ChatGPT 聊,不用我增加太多上下文,它就能理解 Nuwa 上的 AI Agent 能做什麼,是如何工作的。

所以記憶功能會是後面所有 AI 應用發力的重要方向,包括 AI Agent。既然大家背後都調用的是大模型接口,差距主要出現在兩個方面:

1. 工具集 tools:AI Agent 是否可以依賴 tools 做更多的事情。
2. 記憶能力:AI Agent 是否更懂你。

如何管理記憶?

AI Agent 的記憶應該如何管理?把和它所有的回話內容都作爲記憶,是一種簡單粗暴的方案。更好的方式是讓 AI 來管理自己的記憶。Langchain 前一段時間推出的 langmem SDK 就是這個思路,給 AI 一組 tools 來管理記憶,由 AI 來決定什麼應該記錄下來。

Nuwa 設計的時候也是這個思路,提供了一組記憶的 Action:add/update/remove/compact。每次交互,AI 可以調用對應的 Action 來維護自己的記憶。大多數場景下,它也能工作,比如一個給用戶分發測試幣的 Agent,限制每個用戶每天只能領一次,它會通過記憶來保存領取記錄。

這種記憶的工作方式大體上是一種自動對回話的分析、評估和總結,和真正的人類的記憶方式還是有差距。

AI 真的理解“記憶”嗎?

簡單的一個測試用例是和 AI 玩猜數字遊戲,讓它想一個數字,然後你來猜。實際上 AI 並沒有真正“想”一個數字,然後讓你來猜,而是騙你和它交互幾次後假裝你猜對了,因爲它並沒有地方保存“想”的內容。而給它記憶工具後,我設想它會用記憶工具來保存“想”了但不說出來的內容,但實際上 AI 並沒有自然理解“想”和記憶之間的關系。除非你明確告訴它,“請想一個數字,並用記憶工具保存下來”,否則它還是在瞎編。

這個例子看起來簡單,但其實暴露了一個關鍵問題:AI 在當前階段並不能自然地把“內部思考”和“記憶”建立連接。它對“記憶”的使用,更多是響應指令而非主動演化。

多人交互下的記憶挑戰

更大的挑戰出現在把 AI Agent 放在社交環境中。讓它和多個人交互時,該怎麼管理記憶?

如果 AI Agent 的記憶只是跨某一個人的多個會話,上面的機制大致可用。但如果它在一個社交網絡中存在、與多個不同的用戶互動,會遇到兩個典型問題:

1. 記憶的存儲與隔離問題:如果把所有人的交互內容全都記下來,每次交互都要加載,容易導致上下文爆炸。
2. 共享記憶的判定問題:什麼樣的信息需要被跨主體共享?什麼又是應該保留在“對某個用戶”的記憶中?這是當前的 AI 很難做出判斷的。

Nuwa 的設計裏,是按 Agent 交互對象的地址做隔離,在 Agent 自己地址的記憶中保存跨主體的共享內容。但這種機制需要 AI 自己意識到“這個信息是共享的”,實踐結果看來,AI 的表現比較差。

舉個例子:我給 AI Agent 轉了一筆 Coin,告訴它,“當另一個用戶 xxx 來和你交流時,順便轉給他。” 這是個很典型的共享記憶。但 AI 並不理解這個信息是它自己的一個“承諾”,需要保存成共享記憶,未來使用。

記憶的風險與未來方向

AI Agent 的記憶能力還有很大的發展空間。一方面來自 Agent 開發者對提示詞和工具的不斷打磨,另一方面也依賴模型本身的進化。特別是:

1. 記憶的歸因能力:AI 是否能夠理解某段信息是“我對某人的承諾”還是“某人的請求”還是“我曾經的推測”?現在這類“語義歸因”還很薄弱。
2. 記憶與預測的關系:好的記憶不僅是回顧,更是一種前瞻能力。哪些信息未來可能會被用到,這其實是一種對未來的推理。

記憶與狀態

AI Agent 的記憶能力,還有很長的路要走。它不是單純的存儲問題,而是認知結構的問題——它需要理解什麼該記住、記到哪裏、什麼時候該忘記。

其實可以換個角度來看這個問題。如果我們把 Prompt 理解爲“規則”,把記憶理解爲“狀態”,那 AI Agent 的整個行爲過程,本質上就是一個有狀態的推理系統。

從這個視角出發,記憶接口就不應該只是“記錄對話”的簡單能力,而應該支持一組結構化的狀態類型。比如:

1. 用戶偏好這樣的 Key-Value 狀態
2. 歷史交互這樣的時間序列
3. 對象狀態的 Map 結構
4. 甚至更復雜的圖結構,來表達社交關系、任務依賴或因果鏈條

總結

這個方向無論是從產品、算法,還是系統設計角度看,都是一個正在快速演化、充滿機會的前沿領域。
AGENT-13.72%
PROMPT2.76%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)