一文徹底搞懂大模型 - RAG(檢索、增強、生成)

圖片

RAG(Retrieval-Augmented Generation,檢索增強生成) 是一種結合了信息檢索技術與語言生成模型的人工智能技術。該技術通過從外部知識庫中檢索相關信息,並將其作爲提示(Prompt)輸入給大型語言模型(LLMs),以增強模型處理知識密集型任務的能力,如問答、文本摘要、內容生成等。RAG 模型由 Facebook AI Research(FAIR)團隊於 2020 年首次提出,並迅速成爲大模型應用中的熱門方案。

圖片

一、檢索增強生成(RAG)

**什麼是 RAG?**RAG(Retrieval-Augmented Generation,檢索增強生成),RAG 是一種 AI 框架,它將傳統信息檢索系統(例如數據庫)的優勢與生成式大語言模型 (LLM) 的功能結合在一起。

LLM 通過將這些額外的知識與自己的語言技能相結合,可以撰寫更準確、更具時效性且更貼合具體需求的文字。

圖片

什麼是 RAG?

**如何理解 RAG?**通過上一個問題,我們知道了什麼是 RAG?瞭解到 RAG 是一種結合了信息檢索、文本增強和文本生成的自然語言處理(NLP)的技術。

RAG 的目的是通過從外部知識庫檢索相關信息來輔助大語言模型生成更準確、更豐富的文本內容。那我們如何理解 RAG 的檢索、增強和生成呢?

  1. 檢索:檢索是 RAG 流程的第一步,從預先建立的知識庫中檢索與問題相關的信息。這一步的目的是爲後續的生成過程提供有用的上下文信息和知識支撐。

  2. 增強:RAG 中增強是將檢索到的信息用作生成模型(即大語言模型)的上下文輸入,以增強模型對特定問題的理解和回答能力。這一步的目的是將外部知識融入生成過程中,使生成的文本內容更加豐富、準確和符合用戶需求。通過增強步驟,LLM 模型能夠充分利用外部知識庫中的信息。

  3. 生成:生成是 RAG 流程的最後一步。這一步的目的是結合 LLM 生成符合用戶需求的回答。生成器會利用檢索到的信息作爲上下文輸入,並結合大語言模型來生成文本內容。

RAG 的 “檢索、增強、生成”,誰增強了誰,誰生成了答案,主語很重要。是從知識庫中檢索到的問答對,增強了 LLM 的提示詞(prompt),LLM 拿着增強後的 Prompt 生成了問題答案。

圖片

如何理解 RAG?

**如何使用 RAG?**瞭解了什麼是 RGA,同步也理解了 RAG 的檢索、增強和生成。那我們如何使用 RAG 呢?接下來以 RAG 搭建知識問答系統具體步驟爲例,來講解如何使用 RAG?

  1. 數據準備與知識庫構建
  1. 檢索模塊設計:
  1. 生成模塊設計:

大家可以結合自己的業務領域知識,開始搭建醫療、法律、產品知識問答。先搭建 Demo,然後工作中不斷完善知識庫問答對。

圖片

如何使用 RAG?

二、RAG 的原理、流程及架構

**RAG 工作原理是什麼?**大型語言模型(LLM)面臨兩個問題,第一個問題是 LLM 會產生幻覺,第二個是 LLM 的知識中斷。

  1. 知識截止:當 LLM 返回的信息與模型的訓練數據相比過時時。每個基礎模型都有知識截止,這意味着其知識僅限於訓練時可用的數據。

  2. 幻覺:當模型自信地做出錯誤反應時,就會發生幻覺。

檢索增強生成 (RAG) 擺脫了知識限制,整合了外部數據,從外部知識庫中檢索相關信息,增強模型的生成能力。

圖片

RAG 工作原理是什麼?

****RAG 工作流程是什麼?通過檢索增強技術,將用戶查詢與索引知識融合,利用大語言模型生成準確回答。

  1. 知識準備:收集並轉換知識文檔爲文本數據,進行預處理和索引。

  2. 嵌入與索引:使用嵌入模型將文本轉換爲向量,並存儲在向量數據庫中。

  3. 查詢檢索:用戶查詢轉換爲向量,從數據庫中檢索相關知識。

  4. 提示增強:結合檢索結果構建增強提示模版。

  5. 生成回答:大語言模型根據增強模版生成準確回答。

圖片

RAG 工作流程是什麼?

**RAG 技術架構是什麼?**RAG 技術架構主要由兩個核心模塊組成,檢索模塊(Retriever)和生成模塊(Generator)。

  1. 檢索模塊(Retriever):
  1. 生成模塊(Generator):

結合高效的檢索模塊(Retriever)與強大的生成模型(Generator),實現基於外部知識增強的自然語言生成能力。

圖片

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/r2gv2CXz17lCzuH5JamcXg