AI Agent 記憶技術淺析
什麼是 Agent 記憶?
Agent 記憶(Agent Memory)是指 AI Agent 在執行任務過程中存儲和管理信息的能力和機制。它類似於人類的記憶系統,使 Agent 能夠記住過去的交互、經驗和知識,並在後續任務中利用這些信息做出更好的決策。這種記憶機制對於實現持續學習和處理長期任務至關重要。
什麼 Agent 需要記憶?
**從技術角度來看,Agent 的記憶本質上是對大模型有限上下文的一種擴展。**在 Agent 的生命週期中,用戶或 Agent 會生成大量數據,而 AI 大模型能夠處理的上下文是有限的,通常爲 16K 到 2M tokens。這意味着,僅憑 AI 自身的上下文處理能力,無法直接處理如此龐大的數據量。
從產品角度看,Agent 記憶能夠實現個性化交互、保持上下文連貫性,最重要的是有效降低運營成本。
- 個性化交互:例如,用戶請求 AI 推薦一部電影。如果 Agent 具有記憶,AI 可以根據用戶的歷史興趣推薦用戶喜歡的電影類型,避免重複推薦已看過的電影,並根據用戶的偏好推薦更符合其口味的影片。這種個性化體驗可以增強用戶黏性和滿意度,提升使用頻率。
- 保持上下文連貫性:自然語言交互的特殊性要求 AI 能夠理解上下文,否則即使在同一個對話中也可能產生歧義或不連貫的回答。例如,用戶詢問 “昨晚的電影怎麼樣?” 如果沒有記憶,AI 可能無法理解用戶指的是哪一部電影。但如果 AI 具備記憶,它可以回憶起用戶最近觀看的電影,並準確迴應:“昨晚您看的是《復仇者聯盟》,整體評分較高,您覺得怎麼樣?”這樣可以保持對話的流暢性和相關性,避免重複詢問和誤解。
- 降低運營成本:沒有記憶的情況下,AI 每次對話都需要重新讀取歷史記錄並進行上下文推理,這會增加計算資源的消耗並延長響應時間,影響用戶體驗。而有記憶後,AI 可以直接利用用戶的歷史信息和偏好來提供服務,避免每次都從頭處理所有對話內容。這種方式大大減少了對後端計算的需求,提高了效率,降低了服務器和存儲成本,從而有效減少運營成本。
RAG 與記憶的區別
嚴格來說,記憶是 RAG(Retrieval-Augmented Generation,檢索增強生成)的一個子集,二者都從外部提取信息並融入到 LLM(大語言模型)生成的提示中,但它們的應用場景和目標有所不同。核心區別在於:RAG 側重於知識爲中心,而記憶側重於以用戶信息爲中心。
-
使用場景
-
RAG:用於在大型文檔集合(如公司 Wiki、技術文檔等)中檢索信息。
-
記憶:專注於管理用戶互動中的個性化信息,尤其是在多用戶環境中。
-
信息密度
-
RAG:處理密集的非結構化數據(如文本、表格),主要用於事實檢索。
-
記憶:處理用戶與 Agent 之間的多輪會話數據,注重優化交互體驗。
-
檢索方式
-
RAG:通過語義搜索和嵌入式檢索來匹配精確文檔。
-
記憶:側重於總結和壓縮互動中的關鍵信息,優化上下文體驗。
常見的 Agent 記憶機制對比
以下是目前最主流的幾種記憶設計機制的對比(圖片來公衆號堅白 Gustavo):
下面是一個具體的例子,幫助大家理解這幾種記憶機制的區別:
參考資料
-
《A Survey on the Memory Mechanism of Large Language Model based Agents》
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/aioG43Q5lSivEBtARnkGPw