本地知識庫的一點執(zhí)念

DeepSeek的本地部署總算完成了惨撇，我采用的是14B參數(shù)模型况毅，大小為9G导犹，在自己的筆記本上（4060 8G/32G內(nèi)存）上跑代碼和一般推理，以及簡單的文章生成和潤色桨仿，都沒有什么大問題（主要是最近的網(wǎng)絡(luò)測的“服務(wù)器忙”太頻繁了＞Φ汀）

最近一直在嘗試下一個部署方案，就是本地知識庫的建設(shè)服傍，看看自己一大堆的計算機和算法的電子書钱雷，以及平時搜集的文章資料，希望有個地方能利用DeepSeek和好的向量化工具（數(shù)據(jù)庫）來實現(xiàn)吹零，但是目前看效果不是很理想罩抗。

已經(jīng)嘗試的方法有：

第一種：anythingLLM + ollama+ DeepSeek R1 (本地化14B)+nomic-embed-text（嵌入式處理模型）

第二種：cherry studio+ollama + DeepSeek R1(本地化14B）+BAAI/bge-large-en-v1.5（嵌入式處理模型）

初步結(jié)論：

1. 從功能和界面使用上看，個人更喜歡cherry studio一些灿椅，因為更簡潔套蒂，功能更豐富一些钞支。

2. 從最終的使用效果上看，兩個方案都不盡如人意操刀，雖然推理大模型都是使用的本地DeepSeek R1(14B）烁挟，但是關(guān)鍵在于投喂了本地文檔之后，如txt骨坑，pdf文件后撼嗓，向量化處理的過程不是很理想，就是在切分的時候欢唾，邏輯性還是差了一些静稻，過于分散和凌亂，缺乏邏輯性匈辱。也給后面的推理大模型的分析奠定了不好的基礎(chǔ)振湾。

后續(xù)的計劃：

多嘗試一些（嵌入式）向量化處理的大模型，以及在投喂資料時亡脸，注意的文件格式要求押搪，比如采用問答式的資料就更容易處理一些。

什么是RAG浅碾？

補充一下RAG的相關(guān)知識背景大州。

一、什么是RAG垂谢？

RAG （Retrieval-Augmented Generation）檢索增強生成厦画，是一種通過整合外部知識庫來增強大模型（LLM）的性能的模式。最簡單的理解滥朱，可以認為是給大模型外掛了一個知識庫根暑。

二、為什么要使用RAG徙邻？

很多大模型的問題排嫌，多數(shù)是由于數(shù)據(jù)缺失造成的，企業(yè)中解決這類數(shù)據(jù)確實的問題缰犁，通常的方案是采取企業(yè)向量知識庫的方式淳地，在應(yīng)用Prompt的時候，先從企業(yè)知識庫中檢索與Prompt關(guān)聯(lián)的知識帅容，然后把領(lǐng)域知識和原始Prompt整合在一起颇象，最后作為大模型的輸入。

這樣大模型就了解了領(lǐng)域?qū)I(yè)知識并徘，也能更好的回答問題遣钳。

三、RAG怎么使用饮亏？

一個典型的RAG框架耍贾，主要包含兩個階段：知識庫的構(gòu)建階段阅爽，知識庫的應(yīng)用階段

3.1 知識庫的構(gòu)建階段

3.1 知識庫的應(yīng)用階段

四、RAG的優(yōu)勢

在企業(yè)環(huán)境中荐开，對于大模型的準確性付翁、數(shù)據(jù)隱私安全以及信息更新速度有著極高的要求。而RAG（檢索增強生成）框架恰恰能夠很好地滿足這些需求晃听。

1百侧、準確性方面，RAG通過結(jié)合傳統(tǒng)基于檢索的方法與先進的生成式AI技術(shù)能扒，不僅能夠利用外部知識庫來豐富回答的內(nèi)容佣渴，還能確保所生成的信息更加精準可靠。這種機制有效地減少了生成錯誤或誤導(dǎo)性答案的可能性初斑，從而為企業(yè)決策提供了強有力的支持辛润。

2、安全性方面见秤，RAG允許企業(yè)在本地部署自己的私有知識庫砂竖，并且只允許模型訪問該特定的數(shù)據(jù)集進行學(xué)習(xí)和查詢，這樣既能保證敏感信息不外泄鹃答，又能讓模型根據(jù)最新的內(nèi)部資料做出最恰當?shù)幕卮鸷醭巍＿@種方式極大地增強了用戶對系統(tǒng)安全性的信心。

3测摔、時效性方面置济，由于RAG架構(gòu)支持動態(tài)更新知識庫內(nèi)容，因此它可以根據(jù)企業(yè)的實際需要快速調(diào)整并反映最新情況锋八，這為智能客服等應(yīng)用場景帶來了極大的靈活性浙于。例如，在客戶服務(wù)領(lǐng)域查库，RAG可以幫助即時解決客戶疑問路媚，提供個性化建議，極大提升了用戶體驗和服務(wù)效率樊销。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市脏款，隨后出現(xiàn)的幾起案子围苫，更是在濱河造成了極大的恐慌，老刑警劉巖撤师，帶你破解...
沈念sama閱讀 222,378評論 6贊 516
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件剂府，死亡現(xiàn)場離奇詭異，居然都是意外死亡剃盾，警方通過查閱死者的電腦和手機腺占，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,970評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門淤袜，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人衰伯，你說我怎么就攤上這事铡羡。” “怎么了意鲸？”我有些...
開封第一講書人閱讀 168,983評論 0贊 362
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵烦周，是天一觀的道長。經(jīng)常有香客問我怎顾，道長读慎，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 59,938評論 1贊 299
?港島之戀（遺憾婚禮）
正文為了忘掉前任槐雾，我火速辦了婚禮夭委，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘募强。我一直安慰自己闰靴，他們只是感情好，可當我...
茶點故事閱讀 68,955評論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布钻注。她就那樣靜靜地躺著蚂且，像睡著了一般。火紅的嫁衣襯著肌膚如雪幅恋。梳的紋絲不亂的頭發(fā)上杏死，一...
開封第一講書人閱讀 52,549評論 1贊 312
城市分裂傳說
那天，我揣著相機與錄音捆交，去河邊找鬼淑翼。笑死，一個胖子當著我的面吹牛品追，可吹牛的內(nèi)容都是我干的玄括。我是一名探鬼主播，決...
沈念sama閱讀 41,063評論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼肉瓦，長吁一口氣：“原來是場噩夢啊……” “哼遭京！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起泞莉，我...
開封第一講書人閱讀 39,991評論 0贊 277
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤哪雕，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后鲫趁，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體斯嚎，經(jīng)...
沈念sama閱讀 46,522評論 1贊 319
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,604評論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了堡僻。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片糠惫。...
茶點故事閱讀 40,742評論 1贊 353
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖钉疫，靈堂內(nèi)的尸體忽然破棺而出硼讽，到底是詐尸還是另有隱情，我是刑警寧澤陌选，帶...
沈念sama閱讀 36,413評論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布理郑，位于F島的核電站，受9級特大地震影響咨油，放射性物質(zhì)發(fā)生泄漏您炉。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 42,094評論 3贊 335
男人毒藥：我在死后第九天來索命
文/蒙蒙一役电、第九天我趴在偏房一處隱蔽的房頂上張望赚爵。院中可真熱鬧，春花似錦法瑟、人聲如沸冀膝。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,572評論 0贊 25
一樁弒父案霎挟，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽窝剖。三九已至，卻和暖如春酥夭，著一層夾襖步出監(jiān)牢的瞬間赐纱，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,671評論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工熬北，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留疙描，地道東北人。一個月前我還...
沈念sama閱讀 49,159評論 3贊 378
代替公主和親
正文我出身青樓讶隐，卻偏偏與公主長得像起胰，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子巫延，可洞房花燭夜當晚...
茶點故事閱讀 45,747評論 2贊 361

本地知識庫的一點執(zhí)念

初步結(jié)論：

后續(xù)的計劃：

什么是RAG浅碾？

推薦閱讀更多精彩內(nèi)容