本地知識庫的一點執(zhí)念

DeepSeek的本地部署總算完成了惨撇,我采用的是14B參數(shù)模型况毅,大小為9G导犹,在自己的筆記本上(4060 8G/32G內(nèi)存)上跑代碼和一般推理,以及簡單的文章生成和潤色桨仿,都沒有什么大問題(主要是最近的網(wǎng)絡(luò)測的“服務(wù)器忙”太頻繁了>Φ汀)

最近一直在嘗試下一個部署方案,就是本地知識庫的建設(shè)服傍,看看自己一大堆的計算機和算法的電子書钱雷,以及平時搜集的文章資料,希望有個地方能利用DeepSeek和好的向量化工具(數(shù)據(jù)庫)來實現(xiàn)吹零,但是目前看效果不是很理想罩抗。

已經(jīng)嘗試的方法有:

第一種:anythingLLM + ollama+ DeepSeek R1 (本地化14B)+nomic-embed-text(嵌入式處理模型)

第二種:cherry studio+ollama + DeepSeek R1(本地化14B)+BAAI/bge-large-en-v1.5(嵌入式處理模型)

初步結(jié)論:

1. 從功能和界面使用上看,個人更喜歡cherry studio一些灿椅,因為更簡潔套蒂,功能更豐富一些钞支。

2. 從最終的使用效果上看,兩個方案都不盡如人意操刀,雖然推理大模型都是使用的本地DeepSeek R1(14B)烁挟,但是關(guān)鍵在于投喂了本地文檔之后,如txt骨坑,pdf文件后撼嗓,向量化處理的過程不是很理想,就是在切分的時候欢唾,邏輯性還是差了一些静稻,過于分散和凌亂,缺乏邏輯性匈辱。也給后面的推理大模型的分析奠定了不好的基礎(chǔ)振湾。

后續(xù)的計劃:

多嘗試一些(嵌入式)向量化處理的大模型,以及在投喂資料時亡脸,注意的文件格式要求押搪,比如采用問答式的資料就更容易處理一些。

什么是RAG浅碾?

補充一下RAG的相關(guān)知識背景大州。

一、什么是RAG垂谢?

RAG (Retrieval-Augmented Generation)檢索增強生成厦画,是一種通過整合外部知識庫來增強大模型(LLM)的性能的模式。最簡單的理解滥朱,可以認為是給大模型外掛了一個知識庫根暑。

二、為什么要使用RAG徙邻?

很多大模型的問題排嫌,多數(shù)是由于數(shù)據(jù)缺失造成的,企業(yè)中解決這類數(shù)據(jù)確實的問題缰犁,通常的方案是采取企業(yè)向量知識庫的方式淳地,在應(yīng)用Prompt的時候,先從企業(yè)知識庫中檢索與Prompt關(guān)聯(lián)的知識帅容,然后把領(lǐng)域知識和原始Prompt整合在一起颇象,最后作為大模型的輸入。

這樣大模型就了解了領(lǐng)域?qū)I(yè)知識并徘,也能更好的回答問題遣钳。

三、RAG怎么使用饮亏?

一個典型的RAG框架耍贾,主要包含兩個階段:知識庫的構(gòu)建階段阅爽,知識庫的應(yīng)用階段

3.1 知識庫的構(gòu)建階段

3.1 知識庫的應(yīng)用階段

四、RAG的優(yōu)勢

在企業(yè)環(huán)境中荐开,對于大模型的準確性付翁、數(shù)據(jù)隱私安全以及信息更新速度有著極高的要求。而RAG(檢索增強生成)框架恰恰能夠很好地滿足這些需求晃听。

1百侧、準確性方面,RAG通過結(jié)合傳統(tǒng)基于檢索的方法與先進的生成式AI技術(shù)能扒,不僅能夠利用外部知識庫來豐富回答的內(nèi)容佣渴,還能確保所生成的信息更加精準可靠。這種機制有效地減少了生成錯誤或誤導(dǎo)性答案的可能性初斑,從而為企業(yè)決策提供了強有力的支持辛润。

2、安全性方面见秤,RAG允許企業(yè)在本地部署自己的私有知識庫砂竖,并且只允許模型訪問該特定的數(shù)據(jù)集進行學(xué)習(xí)和查詢,這樣既能保證敏感信息不外泄鹃答,又能讓模型根據(jù)最新的內(nèi)部資料做出最恰當?shù)幕卮鸷醭巍_@種方式極大地增強了用戶對系統(tǒng)安全性的信心。

3测摔、時效性方面置济,由于RAG架構(gòu)支持動態(tài)更新知識庫內(nèi)容,因此它可以根據(jù)企業(yè)的實際需要快速調(diào)整并反映最新情況锋八,這為智能客服等應(yīng)用場景帶來了極大的靈活性浙于。例如,在客戶服務(wù)領(lǐng)域查库,RAG可以幫助即時解決客戶疑問路媚,提供個性化建議,極大提升了用戶體驗和服務(wù)效率樊销。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市脏款,隨后出現(xiàn)的幾起案子围苫,更是在濱河造成了極大的恐慌,老刑警劉巖撤师,帶你破解...
    沈念sama閱讀 222,378評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件剂府,死亡現(xiàn)場離奇詭異,居然都是意外死亡剃盾,警方通過查閱死者的電腦和手機腺占,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,970評論 3 399
  • 文/潘曉璐 我一進店門淤袜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人衰伯,你說我怎么就攤上這事铡羡。” “怎么了意鲸?”我有些...
    開封第一講書人閱讀 168,983評論 0 362
  • 文/不壞的土叔 我叫張陵烦周,是天一觀的道長。 經(jīng)常有香客問我怎顾,道長读慎,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,938評論 1 299
  • 正文 為了忘掉前任槐雾,我火速辦了婚禮夭委,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘募强。我一直安慰自己闰靴,他們只是感情好,可當我...
    茶點故事閱讀 68,955評論 6 398
  • 文/花漫 我一把揭開白布钻注。 她就那樣靜靜地躺著蚂且,像睡著了一般。 火紅的嫁衣襯著肌膚如雪幅恋。 梳的紋絲不亂的頭發(fā)上杏死,一...
    開封第一講書人閱讀 52,549評論 1 312
  • 那天,我揣著相機與錄音捆交,去河邊找鬼淑翼。 笑死,一個胖子當著我的面吹牛品追,可吹牛的內(nèi)容都是我干的玄括。 我是一名探鬼主播,決...
    沈念sama閱讀 41,063評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼肉瓦,長吁一口氣:“原來是場噩夢啊……” “哼遭京!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起泞莉,我...
    開封第一講書人閱讀 39,991評論 0 277
  • 序言:老撾萬榮一對情侶失蹤哪雕,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后鲫趁,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體斯嚎,經(jīng)...
    沈念sama閱讀 46,522評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,604評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了堡僻。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片糠惫。...
    茶點故事閱讀 40,742評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖钉疫,靈堂內(nèi)的尸體忽然破棺而出硼讽,到底是詐尸還是另有隱情,我是刑警寧澤陌选,帶...
    沈念sama閱讀 36,413評論 5 351
  • 正文 年R本政府宣布理郑,位于F島的核電站,受9級特大地震影響咨油,放射性物質(zhì)發(fā)生泄漏您炉。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,094評論 3 335
  • 文/蒙蒙 一役电、第九天 我趴在偏房一處隱蔽的房頂上張望赚爵。 院中可真熱鬧,春花似錦法瑟、人聲如沸冀膝。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,572評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽窝剖。三九已至,卻和暖如春酥夭,著一層夾襖步出監(jiān)牢的瞬間赐纱,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,671評論 1 274
  • 我被黑心中介騙來泰國打工熬北, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留疙描,地道東北人。 一個月前我還...
    沈念sama閱讀 49,159評論 3 378
  • 正文 我出身青樓讶隐,卻偏偏與公主長得像起胰,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子巫延,可洞房花燭夜當晚...
    茶點故事閱讀 45,747評論 2 361

推薦閱讀更多精彩內(nèi)容