語義召回模型-TwinBert

Microsoft在2020年提出了TwinBERT: Distilling Knowledge to Twin-Structured Compressed BERT Models for Large-Scale Retrieval這篇論文萎战。今天有幸看了看届吁，簡單的跟大家分享下擒悬。

解決問題

論文主要解決的問題是：性能~ 性能~ 性能~~~

Online Server需要快速處理，尤其是在召回階段巡球，面對上億級Doc，為此減少在線計(jì)算大勢所趨。

架構(gòu)原理

TwinBert就是在這種背景下應(yīng)運(yùn)而生的厅篓，如下圖結(jié)構(gòu)：

image.png

主要講下上面這張圖：

整體：

兩個(gè)對稱的Bert，左邊的Bert用于Query建模捶码，右邊的Bert用于Title keyword建模（或者Doc Context keyword建模）羽氮。
兩個(gè)Bert走完后，再各自經(jīng)過一個(gè)Pooling Layer惫恼，池化層档押，聽起來很高大上，其實(shí)很簡單祈纯，主要是將序列中每個(gè)token的向量搞在一起令宿，做成一個(gè)向量。 Query做成一個(gè)向量腕窥， keyword做成一個(gè)向量粒没，以方便進(jìn)行后面的Cross Layer的交互。池化層有兩個(gè)操作二選一簇爆，【用CLS】或者【所有tokens向量平均加權(quán)起來】癞松，其中后者權(quán)重是學(xué)出來的倾贰。

輸入：均為Word Embeding + Position Embeding。因?yàn)閮蛇叾际且痪湓捓雇铮跃蜎]有了Segment Embeding了匆浙。
值得提一下是，論文中是訓(xùn)練的英文的模型厕妖，所對輸入進(jìn)行了Word Hashing首尼，具體說是使用了Tri-letter, 至于什么是Word Hashing ,見本人的另外一文章Word Hashing。

*Transformer Encoder
這里不多說言秸，其中L用的是6層软能。

池化層
見整體部分，已說明举畸。

*Cross Layer
Query做成一個(gè)向量q, keyword做成一個(gè)向量k查排，二者進(jìn)行距離計(jì)算，有兩種方式抄沮，一種是余弦相似度跋核，如下圖：

image.png

另一種是Residual network，這里不多講叛买，有興趣砂代，自身翻閱。

如何訓(xùn)練率挣？

蒸餾方法訓(xùn)練刻伊。

teacher model
所以要搞一個(gè)teacher model，文章用的12層的 query和title關(guān)鍵詞的訓(xùn)練的椒功。二分類捶箱，分為相關(guān)和不相關(guān)。最后輸出一個(gè)概率动漾。
student model
有了teacher model丁屎，現(xiàn)在就開始teach學(xué)生把，將上面講的Cross layer做的輸出通過LR壓縮到區(qū)間（0,1）谦炬，因?yàn)橛嘞业闹涤蚴荹-1悦屏，1].

然后做一個(gè)做交叉熵 cross entropy节沦。如下面公式：

image.png

優(yōu)點(diǎn)

節(jié)省性能键思，Query在線用Bert預(yù)測， Doc提前離線算好刷到索引甫贯。在線只需要做一次Query Bert預(yù)測吼鳞，以及與Doc的向量計(jì)算。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末叫搁，一起剝皮案震驚了整個(gè)濱河市赔桌，隨后出現(xiàn)的幾起案子供炎，更是在濱河造成了極大的恐慌，老刑警劉巖疾党，帶你破解...
沈念sama閱讀 221,198評論 6贊 514
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件音诫，死亡現(xiàn)場離奇詭異，居然都是意外死亡雪位，警方通過查閱死者的電腦和手機(jī)竭钝，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,334評論 3贊 398
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來雹洗，“玉大人香罐，你說我怎么就攤上這事∈敝祝” “怎么了庇茫？”我有些...
開封第一講書人閱讀 167,643評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長螃成。經(jīng)常有香客問我旦签，道長，這世上最難降的妖魔是什么寸宏？我笑而不...
開封第一講書人閱讀 59,495評論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任顷霹，我火速辦了婚禮，結(jié)果婚禮上击吱，老公的妹妹穿的比我還像新娘淋淀。我一直安慰自己，他們只是感情好覆醇，可當(dāng)我...
茶點(diǎn)故事閱讀 68,502評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布朵纷。她就那樣靜靜地躺著，像睡著了一般永脓。火紅的嫁衣襯著肌膚如雪袍辞。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 52,156評論 1贊 308
城市分裂傳說
那天常摧，我揣著相機(jī)與錄音搅吁，去河邊找鬼。笑死落午，一個(gè)胖子當(dāng)著我的面吹牛谎懦，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播溃斋，決...
沈念sama閱讀 40,743評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼界拦，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了梗劫？” 一聲冷哼從身側(cè)響起享甸，我...
開封第一講書人閱讀 39,659評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤截碴，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后蛉威，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體日丹，經(jīng)...
沈念sama閱讀 46,200評論 1贊 319
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,282評論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年蚯嫌，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了聚凹。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,424評論 1贊 352
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡齐帚，死狀恐怖妒牙，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情对妄，我是刑警寧澤湘今，帶...
沈念sama閱讀 36,107評論 5贊 349
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站剪菱，受9級特大地震影響摩瞎，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜孝常，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,789評論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一旗们、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧构灸，春花似錦上渴、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,264評論 0贊 23
一樁弒父案稠氮，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至半开，卻和暖如春隔披，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背寂拆。一陣腳步聲響...
開封第一講書人閱讀 33,390評論 1贊 271
情欲美人皮
我被黑心中介騙來泰國打工奢米，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人纠永。一個(gè)月前我還...
沈念sama閱讀 48,798評論 3贊 376
代替公主和親
正文我出身青樓鬓长，卻偏偏與公主長得像，于是被迫代替她去往敵國和親渺蒿。傳聞我的和親對象是個(gè)殘疾皇子痢士，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,435評論 2贊 359

語義召回模型-TwinBert

解決問題

架構(gòu)原理

如何訓(xùn)練率挣？

優(yōu)點(diǎn)

推薦閱讀更多精彩內(nèi)容