全新知識導向的 RAG 全棧技術綜述

近期，中科大出品了一篇關於知識導向檢索增強型生成（Retrieval-Augmented Generation, RAG）的綜述，全面介紹了 RAG 的基本原理、關鍵組件、特性、挑戰以及在不同領域的應用，並探討了未來發展的 7 種 RAG 技術形態。

RAG 研究組織框架。時間線從 2020 年延續至當下，將 RAG 相關研究分爲三大領域：基礎（包括 RAG 學習和 RAG 框架）、高級以及評估。時間線上還標記了語言模型領域的重要里程碑（如 GPT-3、ChatGPT、GPT-4）。

不同 RAG 綜述的比較。

LLM：是否在大型語言模型的背景下討論 RAG；

多模態：是否涵蓋多模態 RAG；

圖結構：是否討論 RAG 中的圖結構化信息；

高級：對高級 RAG 技術的覆蓋範圍；

評估：是否涉及評估方法；

知識：是否採用以知識爲中心的視角。

一、RAG 基本原理

問題表述：將輸入序列轉換爲輸出序列，通過檢索函數從外部知識庫中提取相關信息，增強生成過程。
檢索：從外部知識源中獲取有用知識，包括文本、圖像、音頻等多種模態，以及結構化和非結構化數據。
生成：結合內部知識和檢索到的外部知識，生成連貫、相關的輸出。
知識整合：將內部知識與檢索到的外部知識進行整合，是 RAG 的核心環節。

三、RAG 的關鍵特性與挑戰

探討了檢索增強型生成（RAG）模型的核心要素和目標，詳細分析了用戶意圖理解、知識檢索、知識整合、答案生成和評估指標等關鍵環節。這些要素共同構成了 RAG 系統的框架，並揭示了其在自然語言處理任務中的重要性和麪臨的挑戰。

精準的用戶意圖理解

準確理解用戶意圖是生成相關響應的關鍵，但用戶查詢的模糊性和多樣性增加了理解難度，需藉助文本建模、查詢重寫等策略提升意圖理解的準確性。

準確的知識檢索

知識檢索爲生成過程提供相關上下文，直接影響輸出質量，但處理大規模數據集、平衡精確度與召回率以及應對動態數據源是其主要挑戰，需優化檢索算法並利用相關性反饋來解決。

無縫的知識整合

將外部知識與內部知識無縫整合是生成連貫輸出的重要環節，面臨處理不同數據類型、解決知識衝突和確保知識時效性的挑戰，可通過多層整合策略靈活處理不同來源的知識。

四、RAG 基本方法

用戶意圖理解：通過查詢分解和查詢重寫等技術，提高查詢質量。
知識源與解析：RAG 可以利用結構化、半結構化、非結構化和多模態知識。
知識嵌入：將知識分割成有意義的單元，並轉換爲向量嵌入，便於檢索。
知識索引：爲大規模數據集創建結構化索引，提高檢索效率。
知識檢索：根據輸入查詢檢索相關知識，包括稀疏檢索、密集檢索和混合檢索策略。
知識整合：通過輸入層、中間層和輸出層整合檢索到的知識。
答案生成：通過去噪和推理生成準確、連貫的輸出。
知識引用：爲生成的內容提供引用，確保透明度和可信度。

RAG 採用的答案生成策略，包括去噪和推理。

五、RAG 的高級方法

RAG 訓練：包括靜態訓練、單向引導訓練和協作訓練，優化檢索和生成組件的協同工作。

多模態 RAG：整合多種模態數據，如圖像、音頻和視頻，以增強輸出。

記憶增強 RAG：引入顯式記憶機制，處理長文檔理解和個性化知識。

Agentic RAG：引入自主 Agent 進行動態優化，處理複雜任務。

六、RAG 未來發展

GraphRAG：結合知識圖譜增強 RAG 的推理能力。

多模態 RAG：整合多種模態數據，提升理解能力。

個性化 RAG：根據用戶偏好和歷史行爲提供個性化響應。

Agentic RAG：通過自主代理進行動態優化，處理複雜任務。

RAG 與生成模型的結合：探索與擴散模型等其他生成模型的結合。

EdgeRAG：在邊緣計算環境中部署 RAG，降低延遲並保護隱私。

可信 RAG：提高 RAG 系統的可解釋性和可信度。

https://arxiv.org/pdf/2503.10677

A Survey on Knowledge-Oriented Retrieval-Augmented Generation

https://github.com/USTCAGI/Awesome-Papers-Retrieval-Augmented-Generation

來源：github.com/USTCAGI/Awesome-Papers-Retrieval-Augmented-Generation

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://mp.weixin.qq.com/s/7y37T1pC3px4j_QT2YvqdQ

猜你喜歡