AI Agent 記憶技術淺析

什麼是 Agent 記憶？

Agent 記憶（Agent Memory）是指 AI Agent 在執行任務過程中存儲和管理信息的能力和機制。它類似於人類的記憶系統，使 Agent 能夠記住過去的交互、經驗和知識，並在後續任務中利用這些信息做出更好的決策。這種記憶機制對於實現持續學習和處理長期任務至關重要。

什麼 Agent 需要記憶？

**從技術角度來看，Agent 的記憶本質上是對大模型有限上下文的一種擴展。**在 Agent 的生命週期中，用戶或 Agent 會生成大量數據，而 AI 大模型能夠處理的上下文是有限的，通常爲 16K 到 2M tokens。這意味着，僅憑 AI 自身的上下文處理能力，無法直接處理如此龐大的數據量。

從產品角度看，Agent 記憶能夠實現個性化交互、保持上下文連貫性，最重要的是有效降低運營成本。

個性化交互：例如，用戶請求 AI 推薦一部電影。如果 Agent 具有記憶，AI 可以根據用戶的歷史興趣推薦用戶喜歡的電影類型，避免重複推薦已看過的電影，並根據用戶的偏好推薦更符合其口味的影片。這種個性化體驗可以增強用戶黏性和滿意度，提升使用頻率。
保持上下文連貫性：自然語言交互的特殊性要求 AI 能夠理解上下文，否則即使在同一個對話中也可能產生歧義或不連貫的回答。例如，用戶詢問 “昨晚的電影怎麼樣？” 如果沒有記憶，AI 可能無法理解用戶指的是哪一部電影。但如果 AI 具備記憶，它可以回憶起用戶最近觀看的電影，並準確迴應：“昨晚您看的是《復仇者聯盟》，整體評分較高，您覺得怎麼樣？”這樣可以保持對話的流暢性和相關性，避免重複詢問和誤解。
降低運營成本：沒有記憶的情況下，AI 每次對話都需要重新讀取歷史記錄並進行上下文推理，這會增加計算資源的消耗並延長響應時間，影響用戶體驗。而有記憶後，AI 可以直接利用用戶的歷史信息和偏好來提供服務，避免每次都從頭處理所有對話內容。這種方式大大減少了對後端計算的需求，提高了效率，降低了服務器和存儲成本，從而有效減少運營成本。

RAG 與記憶的區別

嚴格來說，記憶是 RAG（Retrieval-Augmented Generation，檢索增強生成）的一個子集，二者都從外部提取信息並融入到 LLM（大語言模型）生成的提示中，但它們的應用場景和目標有所不同。核心區別在於：RAG 側重於知識爲中心，而記憶側重於以用戶信息爲中心。

使用場景
RAG：用於在大型文檔集合（如公司 Wiki、技術文檔等）中檢索信息。
記憶：專注於管理用戶互動中的個性化信息，尤其是在多用戶環境中。
信息密度
RAG：處理密集的非結構化數據（如文本、表格），主要用於事實檢索。
記憶：處理用戶與 Agent 之間的多輪會話數據，注重優化交互體驗。
檢索方式
RAG：通過語義搜索和嵌入式檢索來匹配精確文檔。
記憶：側重於總結和壓縮互動中的關鍵信息，優化上下文體驗。

常見的 Agent 記憶機制對比

以下是目前最主流的幾種記憶設計機制的對比（圖片來公衆號堅白 Gustavo）：

下面是一個具體的例子，幫助大家理解這幾種記憶機制的區別：

參考資料

《A Survey on the Memory Mechanism of Large Language Model based Agents》
https://mp.weixin.qq.com/s/Rcst-mC678YmAWwld0vpVQ

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://mp.weixin.qq.com/s/aioG43Q5lSivEBtARnkGPw

什麼是 Agent 記憶？

什麼 Agent 需要記憶？

RAG 與記憶的區別

常見的 Agent 記憶機制對比

參考資料

猜你喜歡