全新知識導向的 RAG 全棧技術綜述

近期,中科大出品了一篇關於知識導向檢索增強型生成(Retrieval-Augmented Generation, RAG)的綜述,全面介紹了 RAG 的基本原理、關鍵組件、特性、挑戰以及在不同領域的應用,並探討了未來發展的 7 種 RAG 技術形態。

RAG 研究組織框架。時間線從 2020 年延續至當下,將 RAG 相關研究分爲三大領域:基礎(包括 RAG 學習和 RAG 框架)、高級以及評估。時間線上還標記了語言模型領域的重要里程碑(如 GPT-3、ChatGPT、GPT-4)。

不同 RAG 綜述的比較。

LLM:是否在大型語言模型的背景下討論 RAG;

多模態:是否涵蓋多模態 RAG;

圖結構:是否討論 RAG 中的圖結構化信息;

高級:對高級 RAG 技術的覆蓋範圍;

評估:是否涉及評估方法;

知識:是否採用以知識爲中心的視角。

一、RAG 基本原理

三、RAG 的關鍵特性與挑戰

探討了檢索增強型生成(RAG)模型的核心要素和目標,詳細分析了用戶意圖理解、知識檢索、知識整合、答案生成和評估指標等關鍵環節。這些要素共同構成了 RAG 系統的框架,並揭示了其在自然語言處理任務中的重要性和麪臨的挑戰。

準確理解用戶意圖是生成相關響應的關鍵,但用戶查詢的模糊性和多樣性增加了理解難度,需藉助文本建模、查詢重寫等策略提升意圖理解的準確性。

知識檢索爲生成過程提供相關上下文,直接影響輸出質量,但處理大規模數據集、平衡精確度與召回率以及應對動態數據源是其主要挑戰,需優化檢索算法並利用相關性反饋來解決。

將外部知識與內部知識無縫整合是生成連貫輸出的重要環節,面臨處理不同數據類型、解決知識衝突和確保知識時效性的挑戰,可通過多層整合策略靈活處理不同來源的知識。

四、RAG 基本方法

RAG 採用的答案生成策略,包括去噪和推理。

五、RAG 的高級方法

RAG 訓練:包括靜態訓練、單向引導訓練和協作訓練,優化檢索和生成組件的協同工作。

多模態 RAG:整合多種模態數據,如圖像、音頻和視頻,以增強輸出。

記憶增強 RAG:引入顯式記憶機制,處理長文檔理解和個性化知識。

Agentic RAG:引入自主 Agent 進行動態優化,處理複雜任務。

六、RAG 未來發展

GraphRAG:結合知識圖譜增強 RAG 的推理能力。

多模態 RAG:整合多種模態數據,提升理解能力。

個性化 RAG:根據用戶偏好和歷史行爲提供個性化響應。

Agentic RAG:通過自主代理進行動態優化,處理複雜任務。

RAG 與生成模型的結合:探索與擴散模型等其他生成模型的結合。

EdgeRAG:在邊緣計算環境中部署 RAG,降低延遲並保護隱私。

可信 RAG:提高 RAG 系統的可解釋性和可信度。

https://arxiv.org/pdf/2503.10677

A Survey on Knowledge-Oriented Retrieval-Augmented Generation

https://github.com/USTCAGI/Awesome-Papers-Retrieval-Augmented-Generation

來源:github.com/USTCAGI/Awesome-Papers-Retrieval-Augmented-Generation

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/7y37T1pC3px4j_QT2YvqdQ