減少?50%?運維工作量,百度智能云基于大模型構(gòu)建智能問答系統(tǒng)技術(shù)實踐

隨著大模型的飛速發(fā)展猪瞬, AI 技術(shù)開始在更多場景中普及憎瘸。在數(shù)據(jù)庫運維領(lǐng)域,我們的目標是將專家系統(tǒng)和 AI 原生技術(shù)相融合陈瘦,幫助數(shù)據(jù)庫運維工程師高效獲取數(shù)據(jù)庫知識幌甘,并做出快速準確的運維決策。傳統(tǒng)的運維知識庫系統(tǒng)主要采用固化的規(guī)則和策略來記錄管理操作和維護的知識痊项,這些系統(tǒng)的知識檢索方式主要基于關(guān)鍵字搜索和預(yù)定義的標簽或分類锅风,用戶需要具備一定的專業(yè)知識才能有效地利用這些系統(tǒng)。這已不足以滿足現(xiàn)在復(fù)雜多變的運維環(huán)境鞍泉。因此皱埠,借助大模型來提供運維知識并協(xié)助決策成為趨勢。這將在運維能力咖驮、成本控制边器、效率提升和安全性等方面帶來深刻的變革训枢。在數(shù)據(jù)庫領(lǐng)域,AI 技術(shù)應(yīng)用可以劃分為不同場景饰抒,例如知識庫學(xué)習(包括知識問答和知識管理)肮砾、診斷與推理(包括日志分析和故障診斷)、工作輔助(包括 SQL 生成和 SQL 優(yōu)化)等袋坑。本文將主要著重介紹「知識庫智能問答系統(tǒng)」的設(shè)計與實現(xiàn)仗处,旨在為讀者提供深入了解該領(lǐng)域應(yīng)用的思路。

架構(gòu)設(shè)計和實現(xiàn)

技術(shù)方案選型

目前枣宫,大模型已經(jīng)可以通過對自然語言的理解揣摩用戶意圖婆誓,并對原始知識進行匯總、整合也颤,進而生成更具邏輯和完整性的答案洋幻。然而,仍存在以下幾個問題翅娶,導(dǎo)致我們不能直接使用這些模型來對特定領(lǐng)域知識進行問答文留。專業(yè)性不足:作為通用大模型,對專業(yè)領(lǐng)域知識的訓(xùn)練不足竭沫,可能會產(chǎn)生虛假陳述燥翅、準確性不足以及信息豐富度不足的問題。時效性問題:模型的訓(xùn)練數(shù)據(jù)基于某個時間之前的數(shù)據(jù)蜕提,缺乏最新的信息森书,每次添加新數(shù)據(jù)都會導(dǎo)致高昂的訓(xùn)練成本。安全性問題:模型無法訪問企業(yè)內(nèi)部私密文檔谎势,且這些文檔不能直接用于 Fine-Tuning凛膏。為了解決這些問題,業(yè)界采用了如下幾種技術(shù)手段來為大型模型提供額外知識脏榆。Fine-Tuning(微調(diào)):使用特定領(lǐng)域的知識對基礎(chǔ)大模型進行微調(diào)猖毫,以改變神經(jīng)網(wǎng)絡(luò)參數(shù)的權(quán)重。雖然適用于特定任務(wù)或風格须喂,但需要大量資源和高質(zhì)量的訓(xùn)練數(shù)據(jù)鄙麦。Prompt 工程:將行業(yè)領(lǐng)域的知識作為輸入消息提供給模型,讓模型對消息中的知識進行分析和處理镊折。這種方法在正確性和精度上表現(xiàn)良好胯府,但有文本長度限制,對于大規(guī)模數(shù)據(jù)不夠高效恨胚。與傳統(tǒng)搜索結(jié)合:使用傳統(tǒng)搜索技術(shù)構(gòu)建基礎(chǔ)知識庫骂因,然后使用大語言模型處理用戶請求,對召回結(jié)果進行二次加工赃泡。這種方法具有更高的可控性和效率寒波,并適用于大規(guī)模數(shù)據(jù)乘盼。為了確保準確性和效率,我們選擇了第 2 種和第 3 種方式相結(jié)合的方案俄烁,通過向量數(shù)據(jù)庫將知識外掛作為大模型記憶體绸栅,使用 LangChain 作為基礎(chǔ)開發(fā)框架來構(gòu)建知識庫問答系統(tǒng),最終依靠 Prompt 工程和大模型進行交互页屠。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末粹胯,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子辰企,更是在濱河造成了極大的恐慌风纠,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,816評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件牢贸,死亡現(xiàn)場離奇詭異竹观,居然都是意外死亡,警方通過查閱死者的電腦和手機潜索,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,729評論 3 385
  • 文/潘曉璐 我一進店門臭增,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人竹习,你說我怎么就攤上這事速址。” “怎么了由驹?”我有些...
    開封第一講書人閱讀 158,300評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長昔园。 經(jīng)常有香客問我蔓榄,道長,這世上最難降的妖魔是什么默刚? 我笑而不...
    開封第一講書人閱讀 56,780評論 1 285
  • 正文 為了忘掉前任甥郑,我火速辦了婚禮,結(jié)果婚禮上荤西,老公的妹妹穿的比我還像新娘澜搅。我一直安慰自己,他們只是感情好邪锌,可當我...
    茶點故事閱讀 65,890評論 6 385
  • 文/花漫 我一把揭開白布勉躺。 她就那樣靜靜地躺著,像睡著了一般觅丰。 火紅的嫁衣襯著肌膚如雪饵溅。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 50,084評論 1 291
  • 那天妇萄,我揣著相機與錄音蜕企,去河邊找鬼咬荷。 笑死,一個胖子當著我的面吹牛轻掩,可吹牛的內(nèi)容都是我干的幸乒。 我是一名探鬼主播,決...
    沈念sama閱讀 39,151評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼唇牧,長吁一口氣:“原來是場噩夢啊……” “哼罕扎!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起奋构,我...
    開封第一講書人閱讀 37,912評論 0 268
  • 序言:老撾萬榮一對情侶失蹤壳影,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后弥臼,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體宴咧,經(jīng)...
    沈念sama閱讀 44,355評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,666評論 2 327
  • 正文 我和宋清朗相戀三年径缅,在試婚紗的時候發(fā)現(xiàn)自己被綠了掺栅。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,809評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡纳猪,死狀恐怖氧卧,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情氏堤,我是刑警寧澤沙绝,帶...
    沈念sama閱讀 34,504評論 4 334
  • 正文 年R本政府宣布,位于F島的核電站鼠锈,受9級特大地震影響闪檬,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜购笆,卻給世界環(huán)境...
    茶點故事閱讀 40,150評論 3 317
  • 文/蒙蒙 一粗悯、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧同欠,春花似錦样傍、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至襟锐,卻和暖如春炕檩,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,121評論 1 267
  • 我被黑心中介騙來泰國打工笛质, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留泉沾,地道東北人。 一個月前我還...
    沈念sama閱讀 46,628評論 2 362
  • 正文 我出身青樓妇押,卻偏偏與公主長得像跷究,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子敲霍,可洞房花燭夜當晚...
    茶點故事閱讀 43,724評論 2 351

推薦閱讀更多精彩內(nèi)容