解鎖 DeepSeek R1 數據限制:一臺電腦打造高效個人知識庫

當你在使用 DeepSeek 或其它 AI 時,也許可能遇到這樣的問題:

❌你的知識迭代 VS 模型訓練進度

"剛整理完行業前沿白皮書,卻發現 DeepSeek 還卡在半年前的版本斷層"

❌數據絞刑架 VS 硬盤保險箱

"把機密合同餵給 AI?這和在推特公開裸奔有什麼區別"

以上問題,可以通過使用 DeepSeek 構建一個私有知識庫來解決。通過構建知識庫:

✅ 本地化模型實時吞噬新文檔,你的知識庫永遠比大模型快一個版本週期

✅ 數據從不出本地硬盤,不用擔心數據系列

接下來,本文將介紹如何利用 DeepSeek-R1 模型的能力,藉助 Ollama 與 AnythingLLM 兩個工具,實現個人知識庫的構建。

1.Ollama 本地部署 DeepSeek-R1 模型

訪問 ollama 官網,點擊 download。https://ollama.com/

根據電腦系統選擇相應的版本。點擊下載。若下載速度過慢,可關注根根 AI 公衆號並回復 “ollama” 領取安裝包。

打開下載的安裝包,點擊 “Install” ,等待 Ollama 安裝完成。   

等待安裝完成後,按 win+r 鍵,輸入 cmd 調出命令行窗口。

輸入

ollama --version

按下回車後出現版本號,即爲安裝成功。

我們選擇推理能力更強的 deepseek-r1 模型進行本地部署。小編的筆記本顯存爲 6G,因此選擇最小的 1.5b 模型進行部署,如果顯存更大的話,可以選擇更大的模型。例如,選擇 7b 模型能得到更好的回覆,那麼下面代碼中的 “1.5b” 就要改爲“7b”。

在命令行窗口中輸入:

ollama run deepseek-r1:1.5b

按下回車,模型開始自動下載。

模型下載成功後,自動進入對話模式,我們可以在這裏跟模型進行對話。

至此,恭喜你已經完成了 deepseek-r1 模型的本地部署。

2.AnythingLLM 的下載與使用

(1)下載 AnythingLLM

首先進入 AnythingLLM 的官網 https://anythingllm.com/,點擊 “Download for desktop”。

根據電腦系統,選擇合適的版本進行下載。注意,頁面中提示由於最近的 DDOS 事件,可能導致下載鏈接不可用。若無法下載,可關注根根 AI 公衆號,回覆 “AnythingLLM” 領取資源。

打開下載好的安裝包,選擇 “僅爲我安裝” 與安裝路徑,軟件將會自動安裝。

安裝過程中,可能會出現以下錯誤。已經成功安裝 Ollama 後,此錯誤可不予理會。

(2)AnythingLLM 的配置

進入 AnythingLLM 後,點擊 Get started,開始使用。

選擇模型提供爲 “Ollama”,選擇模型爲“deepseek-r1:1.5b” 或其它已經下載好的模型,點擊下一步箭頭。

後面可跳過郵箱註冊步驟,點擊下一步箭頭,新建工作區,設置一個工作區名稱,繼續點擊下一步。

首先點擊左下角的小扳手,打開設置,找到 人工智能提供商 -> Embedder 首選項,選擇嵌入引擎提供商爲 Ollama,模型選擇爲 deepseek-r1:1.5b,最後點擊保存更改。點擊左下角的返回鍵(原來小扳手的位置),返回首頁。

接下來將會進入 AnythingLLM 主頁,點擊剛纔設置的工作區,即可進入對話。

點擊工作區中的上傳標識,即可上傳文件。

第一步,點擊或拖拽上傳文件。我們在這裏上傳了兩篇公衆號的文章、DeepSeek 的兩篇相關論文、一份變電站的相關書籍、一份關於 Java 的 QA 問答對。

第二步,選擇想要上傳到工作區的文件。我們在這裏選擇兩篇跟 Word 接入 DeepSeek 相關的兩篇公衆號文章。在這裏選擇文件時要注意,由於本地部署的模型較小,檢索能力沒有那麼強大,因此儘量選擇與工作區內容相關的文檔進行上傳。內容不相似的文檔可以新建多個工作區。

第三步,點擊 “Move to Workspace” 將文件移動到工作區。

移動完成後,點擊 “Save and Embed”。若文件較大,此步驟會消耗較長的時間。

等待上傳成功後,即可開始對話。

3. 效果測試

(1)根據文檔回答問題

告訴 DeepSeek"總結資料,如何將 DeepSeek 接入 Word",DeepSeek 能夠按照文檔的內容進行總結,生成輸出,但 DeepSeek 目前暫時還無法解析圖片,因此只能根據文檔內的文本內容做出回答。

(2)根據《傷寒雜病論》做出診斷

首先,新建一個工作區,將 txt 格式的《傷寒雜病論》作爲資料上傳。

向 DeepSeek 提問 “我現在腹痛難忍,請告訴我如何用藥”,DeepSeek 按照傷寒雜病論中的內容,告訴我應該使用 “柴胡桂枝湯”,並給出了具體的配方。

(3)數據分析

新建一個工作區,並將一份變電站的各個指標的變化數據上傳,接下來需要 DeepSeek 來分析表內某一個時間段的數據。我們可以通過 AI,直接對錶格數據進行分析。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/fX1UVCgAJbGtZH46EF0usQ