RAG 學(xué)習(xí)筆記(八)

基于博文 Advanced RAG Techniques: an Illustrated Overview 的學(xué)習(xí)和練習(xí)的記錄酌毡。

中文內(nèi)容可以查看博主@寶玉的譯文 高級(jí) RAG 技術(shù):圖解概覽 [譯]

系列筆記:
RAG 學(xué)習(xí)筆記(一)
RAG 學(xué)習(xí)筆記(二)
RAG 學(xué)習(xí)筆記(三)
RAG 學(xué)習(xí)筆記(四)
RAG 學(xué)習(xí)筆記(五)
RAG 學(xué)習(xí)筆記(六)
RAG 學(xué)習(xí)筆記(七)

微調(diào) Encoder 和 LLM

涉及一下兩種深度學(xué)習(xí)模型的微調(diào):

  1. Transformer Encoder:主要提供 Embedding 能力巷波,影響檢索結(jié)果的質(zhì)量
  2. LLM:主要負(fù)責(zé)根據(jù)上下文內(nèi)容回答用戶提問滚粟,影響生成響應(yīng)的結(jié)果

需要注意:基礎(chǔ)預(yù)訓(xùn)練模型基于大量由專業(yè)人員整體的數(shù)據(jù)集刺桃,使用小型數(shù)據(jù)集進(jìn)行微調(diào)會(huì)降低模型的通用能力丑搔。

Encoder 微調(diào)

當(dāng)前針對(duì)搜素優(yōu)化的 Transformer Encoder,效果已經(jīng)很不錯(cuò)了,所以對(duì) Encoder 模型微調(diào)帶來的改進(jìn)還待進(jìn)一步討論犀概。

使用 LlamaIndex notebook: Finetune Embeddings 中的微調(diào)流程立哑,作者對(duì)模型 bge- large-en-v1.5 進(jìn)行微調(diào),僅獲得 2% 的效果提升姻灶。

如果數(shù)據(jù)集來自于非常垂直的領(lǐng)域铛绰,則可以考慮進(jìn)行該微調(diào)。

排序微調(diào)

Cross-encoder 模型用于對(duì)檢索結(jié)果排序产喉。Cross-encoder 的微調(diào)過程大致為:

  • 將查詢語句 q 與檢索結(jié)果中最相關(guān)的 K 個(gè)文本塊 (r1, r2, ..., rk) 成對(duì) (q, ri) 傳遞給 cross-encoder 模型
  • 微調(diào)模型如果查詢 q 和 文本塊 ri 相關(guān)捂掰,則輸出 1,如果不相同則輸出 0

微調(diào)樣例:如何使用 LlamaIndex 微調(diào) cross-encoder曾沈,結(jié)果顯示微調(diào)過后这嚣,cross-encoder 打分的效果提升 4%

LLM 微調(diào)

OpenAI GPT-3.5-turbo 微調(diào)

LlamaIndex notebook: 微調(diào) GPT-3.5-turbo 中介紹了使用 GPT-4 微調(diào) GPT-3.5-turbo 的方法:

  1. 使用 GPT-3.5-turbo 對(duì)一個(gè)文檔生成一些問題
  2. 使用 GPT-4 構(gòu)建一個(gè)對(duì)該文檔進(jìn)行問答的 RAG 系統(tǒng),然后生成問題的答案
  3. 然后使用問答對(duì)來微調(diào) GPT-3.5-turbo

使用 ragas 進(jìn)行測(cè)評(píng)晦譬,基于微調(diào)過后的 GPT 3.5-turbo 構(gòu)建的 RAG 系統(tǒng)疤苹,忠實(shí)度(faithfulness)指標(biāo)提升 4%,說明微調(diào)后的模型能夠更好的使用上下文回答問題敛腌。

利用檢索增強(qiáng)進(jìn)行微調(diào)

Meta AI Research 發(fā)表的論文 RA-DIT: Retrieval Augmented Dual Instruction Tuning 提出了一種使用查詢語句卧土、上下文和回答三元祖,同時(shí)微調(diào) LLM 和 Retriever 的方法(論文中稱為雙編碼器)像樊。

微調(diào)的實(shí)現(xiàn):LlamaIndex notebook:Fine-tuning with Retrieval Augmentation

效果:

  • 使用該技術(shù)微調(diào)的 Openai LLM 和 Llama2 開源模型尤莺,在知識(shí)密集型的任務(wù)上提高了 5% 的性能,在常識(shí)推理的任務(wù)上也增加了幾個(gè)百分點(diǎn)的性能生棍。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末颤霎,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子涂滴,更是在濱河造成了極大的恐慌友酱,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,214評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件柔纵,死亡現(xiàn)場(chǎng)離奇詭異缔杉,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)搁料,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門或详,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人郭计,你說我怎么就攤上這事霸琴。” “怎么了昭伸?”我有些...
    開封第一講書人閱讀 152,543評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵梧乘,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我庐杨,道長(zhǎng)宋下,這世上最難降的妖魔是什么嗡善? 我笑而不...
    開封第一講書人閱讀 55,221評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮学歧,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘各吨。我一直安慰自己枝笨,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,224評(píng)論 5 371
  • 文/花漫 我一把揭開白布揭蜒。 她就那樣靜靜地躺著横浑,像睡著了一般。 火紅的嫁衣襯著肌膚如雪屉更。 梳的紋絲不亂的頭發(fā)上徙融,一...
    開封第一講書人閱讀 49,007評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音瑰谜,去河邊找鬼欺冀。 笑死,一個(gè)胖子當(dāng)著我的面吹牛萨脑,可吹牛的內(nèi)容都是我干的隐轩。 我是一名探鬼主播,決...
    沈念sama閱讀 38,313評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼渤早,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼职车!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起鹊杖,我...
    開封第一講書人閱讀 36,956評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤悴灵,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后骂蓖,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體积瞒,經(jīng)...
    沈念sama閱讀 43,441評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,925評(píng)論 2 323
  • 正文 我和宋清朗相戀三年涯竟,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了赡鲜。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,018評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡庐船,死狀恐怖银酬,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情筐钟,我是刑警寧澤揩瞪,帶...
    沈念sama閱讀 33,685評(píng)論 4 322
  • 正文 年R本政府宣布,位于F島的核電站篓冲,受9級(jí)特大地震影響李破,放射性物質(zhì)發(fā)生泄漏宠哄。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,234評(píng)論 3 307
  • 文/蒙蒙 一嗤攻、第九天 我趴在偏房一處隱蔽的房頂上張望毛嫉。 院中可真熱鬧,春花似錦妇菱、人聲如沸承粤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽辛臊。三九已至,卻和暖如春房交,著一層夾襖步出監(jiān)牢的瞬間彻舰,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評(píng)論 1 261
  • 我被黑心中介騙來泰國打工候味, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留刃唤,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,467評(píng)論 2 352
  • 正文 我出身青樓负溪,卻偏偏與公主長(zhǎng)得像透揣,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子川抡,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,762評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容