全新知識導向的 RAG 全棧技術綜述
近期,中科大出品了一篇關於知識導向檢索增強型生成(Retrieval-Augmented Generation, RAG)的綜述,全面介紹了 RAG 的基本原理、關鍵組件、特性、挑戰以及在不同領域的應用,並探討了未來發展的 7 種 RAG 技術形態。
RAG 研究組織框架。時間線從 2020 年延續至當下,將 RAG 相關研究分爲三大領域:基礎(包括 RAG 學習和 RAG 框架)、高級以及評估。時間線上還標記了語言模型領域的重要里程碑(如 GPT-3、ChatGPT、GPT-4)。
不同 RAG 綜述的比較。
LLM:是否在大型語言模型的背景下討論 RAG;
多模態:是否涵蓋多模態 RAG;
圖結構:是否討論 RAG 中的圖結構化信息;
高級:對高級 RAG 技術的覆蓋範圍;
評估:是否涉及評估方法;
知識:是否採用以知識爲中心的視角。
一、RAG 基本原理
-
問題表述:將輸入序列轉換爲輸出序列,通過檢索函數從外部知識庫中提取相關信息,增強生成過程。
-
檢索:從外部知識源中獲取有用知識,包括文本、圖像、音頻等多種模態,以及結構化和非結構化數據。
-
生成:結合內部知識和檢索到的外部知識,生成連貫、相關的輸出。
-
知識整合:將內部知識與檢索到的外部知識進行整合,是 RAG 的核心環節。
三、RAG 的關鍵特性與挑戰
探討了檢索增強型生成(RAG)模型的核心要素和目標,詳細分析了用戶意圖理解、知識檢索、知識整合、答案生成和評估指標等關鍵環節。這些要素共同構成了 RAG 系統的框架,並揭示了其在自然語言處理任務中的重要性和麪臨的挑戰。
- 精準的用戶意圖理解
準確理解用戶意圖是生成相關響應的關鍵,但用戶查詢的模糊性和多樣性增加了理解難度,需藉助文本建模、查詢重寫等策略提升意圖理解的準確性。
- 準確的知識檢索
知識檢索爲生成過程提供相關上下文,直接影響輸出質量,但處理大規模數據集、平衡精確度與召回率以及應對動態數據源是其主要挑戰,需優化檢索算法並利用相關性反饋來解決。
- 無縫的知識整合
將外部知識與內部知識無縫整合是生成連貫輸出的重要環節,面臨處理不同數據類型、解決知識衝突和確保知識時效性的挑戰,可通過多層整合策略靈活處理不同來源的知識。
四、RAG 基本方法
-
用戶意圖理解:通過查詢分解和查詢重寫等技術,提高查詢質量。
-
知識源與解析:RAG 可以利用結構化、半結構化、非結構化和多模態知識。
-
知識嵌入:將知識分割成有意義的單元,並轉換爲向量嵌入,便於檢索。
-
知識索引:爲大規模數據集創建結構化索引,提高檢索效率。
-
知識檢索:根據輸入查詢檢索相關知識,包括稀疏檢索、密集檢索和混合檢索策略。
-
知識整合:通過輸入層、中間層和輸出層整合檢索到的知識。
-
答案生成:通過去噪和推理生成準確、連貫的輸出。
-
知識引用:爲生成的內容提供引用,確保透明度和可信度。
RAG 採用的答案生成策略,包括去噪和推理。
五、RAG 的高級方法
RAG 訓練:包括靜態訓練、單向引導訓練和協作訓練,優化檢索和生成組件的協同工作。
多模態 RAG:整合多種模態數據,如圖像、音頻和視頻,以增強輸出。
記憶增強 RAG:引入顯式記憶機制,處理長文檔理解和個性化知識。
Agentic RAG:引入自主 Agent 進行動態優化,處理複雜任務。
六、RAG 未來發展
GraphRAG:結合知識圖譜增強 RAG 的推理能力。
多模態 RAG:整合多種模態數據,提升理解能力。
個性化 RAG:根據用戶偏好和歷史行爲提供個性化響應。
Agentic RAG:通過自主代理進行動態優化,處理複雜任務。
RAG 與生成模型的結合:探索與擴散模型等其他生成模型的結合。
EdgeRAG:在邊緣計算環境中部署 RAG,降低延遲並保護隱私。
可信 RAG:提高 RAG 系統的可解釋性和可信度。
https://arxiv.org/pdf/2503.10677
A Survey on Knowledge-Oriented Retrieval-Augmented Generation
https://github.com/USTCAGI/Awesome-Papers-Retrieval-Augmented-Generation
來源:github.com/USTCAGI/Awesome-Papers-Retrieval-Augmented-Generation
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/7y37T1pC3px4j_QT2YvqdQ