語義召回模型-TwinBert

Microsoft在2020年提出了TwinBERT: Distilling Knowledge to Twin-Structured Compressed BERT Models for Large-Scale Retrieval這篇論文萎战。今天有幸看了看届吁,簡單的跟大家分享下擒悬。

解決問題

論文主要解決的問題是:性能~ 性能~ 性能~~~

Online Server需要快速處理,尤其是在召回階段巡球,面對上億級Doc,為此減少在線計(jì)算大勢所趨。

架構(gòu)原理

TwinBert就是在這種背景下應(yīng)運(yùn)而生的厅篓,如下圖結(jié)構(gòu):


image.png

主要講下上面這張圖:

  • 整體:
  1. 兩個(gè)對稱的Bert, 左邊的Bert用于Query建模捶码,右邊的Bert用于Title keyword建模(或者Doc Context keyword建模)羽氮。
  2. 兩個(gè)Bert走完后,再各自經(jīng)過一個(gè)Pooling Layer惫恼,池化層档押,聽起來很高大上,其實(shí)很簡單祈纯,主要是將序列中每個(gè)token的向量搞在一起令宿,做成一個(gè)向量。 Query做成一個(gè)向量腕窥, keyword做成一個(gè)向量粒没,以方便進(jìn)行后面的Cross Layer的交互。 池化層有兩個(gè)操作二選一簇爆,【用CLS】 或者 【所有tokens向量平均加權(quán)起來】癞松,其中后者權(quán)重是學(xué)出來的倾贰。
  • 輸入 : 均為Word Embeding + Position Embeding。 因?yàn)閮蛇叾际且痪湓捓雇铮跃蜎]有了Segment Embeding了匆浙。
    值得提一下是,論文中是訓(xùn)練的英文的模型厕妖,所對輸入進(jìn)行了Word Hashing首尼,具體說是使用了Tri-letter, 至于什么是Word Hashing ,見本人的另外一文章Word Hashing。

*Transformer Encoder
這里不多說言秸,其中L用的是6層软能。

  • 池化層
    見整體部分,已說明举畸。

*Cross Layer
Query做成一個(gè)向量q, keyword做成一個(gè)向量k查排,二者進(jìn)行距離計(jì)算,有兩種方式抄沮,一種是余弦相似度跋核,如下圖:


image.png

另一種是Residual network, 這里不多講叛买,有興趣砂代,自身翻閱。

如何訓(xùn)練率挣?

蒸餾方法訓(xùn)練刻伊。

  • teacher model
    所以要搞一個(gè)teacher model,文章用的12層的 query和title關(guān)鍵詞的訓(xùn)練的椒功。二分類捶箱,分為相關(guān)和不相關(guān)。最后輸出一個(gè)概率动漾。

  • student model
    有了teacher model丁屎, 現(xiàn)在就開始teach學(xué)生把,將上面講的Cross layer做的輸出通過LR壓縮到區(qū)間(0,1)谦炬, 因?yàn)橛嘞业闹涤蚴荹-1悦屏,1].

然后做一個(gè)做交叉熵 cross entropy节沦。如下面公式:


image.png

優(yōu)點(diǎn)

節(jié)省性能键思,Query在線用Bert預(yù)測, Doc提前離線算好刷到索引甫贯。在線只需要做一次Query Bert預(yù)測吼鳞,以及與Doc的向量計(jì)算。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末叫搁,一起剝皮案震驚了整個(gè)濱河市赔桌,隨后出現(xiàn)的幾起案子供炎,更是在濱河造成了極大的恐慌,老刑警劉巖疾党,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件音诫,死亡現(xiàn)場離奇詭異,居然都是意外死亡雪位,警方通過查閱死者的電腦和手機(jī)竭钝,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來雹洗,“玉大人香罐,你說我怎么就攤上這事∈敝祝” “怎么了庇茫?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長螃成。 經(jīng)常有香客問我旦签,道長,這世上最難降的妖魔是什么寸宏? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任顷霹,我火速辦了婚禮,結(jié)果婚禮上击吱,老公的妹妹穿的比我還像新娘淋淀。我一直安慰自己,他們只是感情好覆醇,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布朵纷。 她就那樣靜靜地躺著,像睡著了一般永脓。 火紅的嫁衣襯著肌膚如雪袍辞。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天常摧,我揣著相機(jī)與錄音搅吁,去河邊找鬼。 笑死落午,一個(gè)胖子當(dāng)著我的面吹牛谎懦,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播溃斋,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼界拦,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了梗劫?” 一聲冷哼從身側(cè)響起享甸,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤截碴,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后蛉威,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體日丹,經(jīng)...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年蚯嫌,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了聚凹。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,424評論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡齐帚,死狀恐怖妒牙,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情对妄,我是刑警寧澤湘今,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布,位于F島的核電站剪菱,受9級特大地震影響摩瞎,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜孝常,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一旗们、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧构灸,春花似錦上渴、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至半开,卻和暖如春隔披,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背寂拆。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工奢米, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人纠永。 一個(gè)月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓鬓长,卻偏偏與公主長得像,于是被迫代替她去往敵國和親渺蒿。 傳聞我的和親對象是個(gè)殘疾皇子痢士,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,435評論 2 359

推薦閱讀更多精彩內(nèi)容