使用open-webui+deepseek構(gòu)建本地AI知識庫

本文主要研究一下如何使用OpenWebUI+deepseek構(gòu)建本地AI知識庫

步驟

拉取open-webui鏡像

docker pull ghcr.io/open-webui/open-webui:main

docker啟動

docker run -d -p 3000:8080 \
-e OLLAMA_BASE_URL=http://host.docker.internal:11434 \
ghcr.io/open-webui/open-webui:main

執(zhí)行完之后等一會(大概要三四分鐘)啟動起來了訪問http://localhost:3000/旺入,注冊管理員賬號丹鸿,注冊完要等一會(估計要七八分鐘)頁面才出來
可以-v ./open-webui-data:/app/backend/data來掛載數(shù)據(jù)

看日志是有報錯

ERROR [open_webui.routers.openai] Connection error: Cannot connect to host api.openai.com:443 ssl:default [Connect call failed ('108.160.165.173', 443)]
ERROR [open_webui.routers.openai] Connection error: Cannot connect to host api.openai.com:443 ssl:default [Connect call failed ('108.160.165.173', 443)]
ERROR [open_webui.routers.openai] Connection error: Cannot connect to host api.openai.com:443 ssl:default [Connect call failed ('108.160.165.173', 443)]
ERROR [open_webui.routers.openai] Connection error: Cannot connect to host api.openai.com:443 ssl:default [Connect call failed ('108.160.165.173', 443)]
INFO  [open_webui.routers.ollama] get_all_models()
INFO  [open_webui.routers.ollama] get_all_models()
INFO  [open_webui.routers.ollama] get_all_models()
INFO  [open_webui.routers.ollama] get_all_models()

登錄之后,設(shè)置 --> 管理員設(shè)置 --> 外部鏈接,禁用掉OpenAI API计福,記得保存

開啟聯(lián)網(wǎng)搜索

在設(shè)置 --> 管理員設(shè)置 --> 聯(lián)網(wǎng)搜索 --> 啟用,然后下拉選擇厦酬,這里選擇tavily融撞,可以去https://app.tavily.com/注冊然后獲取api key,最后點擊保存就可以了

截屏2025-02-17 09.38.16.png

示例:今天日期是多少指煎,看open-webui輸出

INFO  [open_webui.routers.retrieval] save_docs_to_vector_db: document 在線時鐘:當(dāng)前時間, 世界時鐘 :: 美國 (United States) - 當(dāng)前時間, 今天日期, ????¤?????—¥??? ???¨???3, 現(xiàn)在北京時間 在線標準北京時間校對 web-search-d8b3e7117d85062f511572e3004ad60997448e8ed9e9b7e3bac5
INFO  [open_webui.routers.retrieval] adding to collection web-search-d8b3e7117d85062f511572e3004ad60997448e8ed9e9b7e3bac5
/pytorch/third_party/ideep/mkl-dnn/src/cpu/aarch64/xbyak_aarch64/src/util_impl_linux.h, 451: Can't read MIDR_EL1 sysfs entry
INFO  [open_webui.retrieval.utils] query_doc:result [['7ee3e76c-7804-4eb7-8dbb-7ca27b0a54ca', 'ef5b7e5c-8a7e-4220-800e-9390e9808034', '97e23c2b-43f7-457a-a086-8b264acb90e8']] [[{'description': '世界時間 - 美國 (United States) - 現(xiàn)在世界各地是什么時間蹋偏?', 'embedding_config': '{"engine": "", "model": "sentence-transformers/all-MiniLM-L6-v2"}', 'language': 'zh', 'source': 'https://24timezones.com/美國/時間', 'start_index': 3508, 'title': '世界時鐘 :: 美國 (United States) - 當(dāng)前時間'}, {'description': '根據(jù)您所在的位置找出今天是什麼日期。了解格式為 mm-dd-yyyy 的確切數(shù)字日期至壤。', 'embedding_config': '{"engine": "", "model": "sentence-transformers/all-MiniLM-L6-v2"}', 'language': 'zh', 'source': 'https://thetimecalculator.org/zh/today-date', 'start_index': 1773, 'title': '今天日期'}, {'description': '世界時間 - 美國 (United States) - 現(xiàn)在世界各地是什么時間威始?', 'embedding_config': '{"engine": "", "model": "sentence-transformers/all-MiniLM-L6-v2"}', 'language': 'zh', 'source': 'https://24timezones.com/美國/時間', 'start_index': 2775, 'title': '世界時鐘 :: 美國 (United States) - 當(dāng)前時間'}]]

結(jié)果如下:
根據(jù)上下文中的信息,今天的日期是 星期一, 二月 17, 2025 [source_id=1]像街。


截屏2025-02-17 10.35.27.png

知識庫管理

  • 設(shè)置 --> 管理員設(shè)置 --> 文檔 --> 語義向量模型引擎 改為ollama黎棠, 語義向量模型改為bge-m3:latest
  • 工作空間 --> 知識庫,點擊+號上傳文檔
  • 使用時需要在聊天框通過#來指定知識庫
  • 設(shè)置 --> 管理員設(shè)置 --> 數(shù)據(jù)庫 --> 下載數(shù)據(jù)庫镰绎,可以導(dǎo)出sqlite數(shù)據(jù)

小結(jié)

整體體驗是docker部署起來脓斩,頁面展示有點慢,聯(lián)網(wǎng)搜索一開始選擇serply不生效畴栖,換成tavily可以生效随静,但是國內(nèi)的搜索引擎還不支持。對于知識庫方面,可以上傳文檔和目錄燎猛,聊天窗口可以指定使用哪個知識庫恋捆,也可以同時開啟聯(lián)網(wǎng)搜索,整體效果還可以重绷,可以同時引用知識庫和搜索引擎的檢索結(jié)果沸停,看日志還會保存到向量數(shù)據(jù)庫(save_docs_to_vector_db)。

doc

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末论寨,一起剝皮案震驚了整個濱河市星立,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌葬凳,老刑警劉巖绰垂,帶你破解...
    沈念sama閱讀 222,378評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異火焰,居然都是意外死亡劲装,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,970評論 3 399
  • 文/潘曉璐 我一進店門昌简,熙熙樓的掌柜王于貴愁眉苦臉地迎上來占业,“玉大人,你說我怎么就攤上這事纯赎∏玻” “怎么了?”我有些...
    開封第一講書人閱讀 168,983評論 0 362
  • 文/不壞的土叔 我叫張陵犬金,是天一觀的道長念恍。 經(jīng)常有香客問我,道長晚顷,這世上最難降的妖魔是什么峰伙? 我笑而不...
    開封第一講書人閱讀 59,938評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮该默,結(jié)果婚禮上瞳氓,老公的妹妹穿的比我還像新娘。我一直安慰自己栓袖,他們只是感情好匣摘,可當(dāng)我...
    茶點故事閱讀 68,955評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著裹刮,像睡著了一般音榜。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上必指,一...
    開封第一講書人閱讀 52,549評論 1 312
  • 那天囊咏,我揣著相機與錄音恕洲,去河邊找鬼塔橡。 笑死梅割,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的葛家。 我是一名探鬼主播户辞,決...
    沈念sama閱讀 41,063評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼癞谒!你這毒婦竟也來了底燎?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,991評論 0 277
  • 序言:老撾萬榮一對情侶失蹤弹砚,失蹤者是張志新(化名)和其女友劉穎双仍,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體桌吃,經(jīng)...
    沈念sama閱讀 46,522評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡朱沃,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,604評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了茅诱。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片逗物。...
    茶點故事閱讀 40,742評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖瑟俭,靈堂內(nèi)的尸體忽然破棺而出翎卓,到底是詐尸還是另有隱情,我是刑警寧澤摆寄,帶...
    沈念sama閱讀 36,413評論 5 351
  • 正文 年R本政府宣布失暴,位于F島的核電站,受9級特大地震影響椭迎,放射性物質(zhì)發(fā)生泄漏锐帜。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,094評論 3 335
  • 文/蒙蒙 一畜号、第九天 我趴在偏房一處隱蔽的房頂上張望缴阎。 院中可真熱鬧,春花似錦简软、人聲如沸蛮拔。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,572評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽建炫。三九已至,卻和暖如春疼蛾,著一層夾襖步出監(jiān)牢的瞬間肛跌,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,671評論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留衍慎,地道東北人转唉。 一個月前我還...
    沈念sama閱讀 49,159評論 3 378
  • 正文 我出身青樓,卻偏偏與公主長得像稳捆,于是被迫代替她去往敵國和親赠法。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,747評論 2 361

推薦閱讀更多精彩內(nèi)容