推薦系統(tǒng)論文閱讀(五十五)-美團(tuán):雙重增強(qiáng)雙塔召回模型

論文:

論文題目:《A Dual Augmented Two-tower Model for Online Large-scale Recommendation》

論文地址:https://dlp-kdd.github.io/assets/pdf/DLP-KDD_2021_paper_4.pdf

可以看到這篇論文是發(fā)表在dlp-kdd上的一篇關(guān)于雙塔召回的論文,這篇論文其實(shí)比較偏工業(yè)界的風(fēng)格,主要的創(chuàng)新點(diǎn)其實(shí)就兩個地方罗珍,我們一起來看看吧堕绩。

一 擒悬、背景

許多現(xiàn)代推薦系統(tǒng)都有非常大的物品庫窍帝,處理大規(guī)模檢索的一個常見工業(yè)方法是使用雙塔模型從內(nèi)容特征中學(xué)習(xí)query和item的表示榕茧。然而垃沦,該模型缺乏兩塔之間的信息交互,此外用押,類別數(shù)據(jù)的不平衡也影響了模型的性能肢簿。在美團(tuán)的首頁推薦場景下,負(fù)責(zé)給所有的業(yè)務(wù)進(jìn)行導(dǎo)流和推薦任務(wù)蜻拨。在首頁推薦場景下池充,物品類別是嚴(yán)重不平衡的。舉個例子來說缎讼,外賣這個類別的商品數(shù)量就比較多收夸,也就是說,如果不加區(qū)分的對所有的物品進(jìn)行訓(xùn)練血崭,那么就會導(dǎo)致整個模型的效果受主要類別主導(dǎo)卧惜,模型的訓(xùn)練就跟少量的類別關(guān)系沒那么大了,這些少樣類別幾乎不會對模型的訓(xùn)練造成影響夹纫。

另外咽瓷,做雙塔的各位都知道,一個比較難受的問題就是query塔跟item塔沒有進(jìn)行交互舰讹,唯一一次交互式在計(jì)算相似度(cos/內(nèi)積)的時候茅姜。為了解決這個問題,張俊林老師在知乎上也說過月匣,可以用senet結(jié)構(gòu)來緩解钻洒,senet的主要效果是信息提純奋姿,讓最有效的信息保留,不重要的信息忽略航唆,這樣在最后計(jì)算cos的時候的交互才是最好的,避免了亂七八糟的信息進(jìn)行交互了院刁。

該論文提出了雙重增強(qiáng)雙塔模型來解決以上兩個問題糯钙。論文設(shè)計(jì)了Adaptive-Mimic Mechanism,來為每一個query和item學(xué)習(xí)一個增強(qiáng)向量退腥,增強(qiáng)向量代表了來自另一個塔的有用信息任岸;此外,論文還在訓(xùn)練階段引入了Category Alignment Loss來緩解類別不平衡的問題狡刘。

二享潜、模型結(jié)構(gòu)

2.1 Embedding層

這個就不在進(jìn)行過多的介紹了,query跟item的特征都經(jīng)過embedding結(jié)構(gòu)生成稠密的特征嗅蔬。

2.2?Dual Augmented layer

對于query和item剑按,都假設(shè)帶有一個對應(yīng)的增強(qiáng)向量auav,并與Embedding層得到的Embedding進(jìn)行concat澜术,作為兩個塔的輸入艺蝴。如對于uid=253,city=SH鸟废,gender=male的用戶猜敢,以及iid=149,price=10盒延,class=cate的item缩擂,對應(yīng)的模型輸入為:

做過雙塔的都知道,在模型經(jīng)過多層dnn后添寺,需要在最后進(jìn)行l(wèi)2正則胯盯,為什么要做正則呢,很多文章都解釋過了计露,這里就簡單提幾點(diǎn):

1.為了模型訓(xùn)練更穩(wěn)定

2.為了檢索一致性陨闹,歸一化后在點(diǎn)積=cos相似度 等價于hnsw中的歐式距離

所以接下來的操作就是:

我們可以從圖中看到,增強(qiáng)向量跟著dnn進(jìn)入了雙塔結(jié)構(gòu)薄坏,但是這個增強(qiáng)向量還有另外的作用趋厉。

這里直接用簡單的話來講解,我們可以看到au可以看作是query側(cè)的增強(qiáng)向量胶坠,除了跟著模型一起訓(xùn)練以外君账,還扮演著對于所有item塔中所有正樣本的輸出向量表示∩蛏疲可以這么理解乡数,我們前面不是說了嗎椭蹄,我們沒辦法在雙塔中進(jìn)行特征交叉,因?yàn)榈貌坏奖舜说男畔⒈硎揪桓埃敲次覀優(yōu)槭裁床蛔约簶?gòu)造出一個偽的item表示呢绳矩,其實(shí)au就是候選item的一種假設(shè),是我們用來進(jìn)行特征交互的假設(shè)向量玖翅。

你可能覺得翼馆,太好了,如果我們直接假設(shè)一個彼此向量就好了金度,這個想法太天衣無縫了应媚?錯了,我們必須要對這個增強(qiáng)向量進(jìn)行限制才行猜极,既然他是我們對另一側(cè)的假設(shè)向量中姜,這個vec就不能太飄,所以我們需要用一個loss進(jìn)行限制:

以loss_u為例跟伏,如果y=0丢胚,則沒有損失,若y=1受扳,則增強(qiáng)向量必須要跟另一個塔的輸出向量越接近嗜桌,則損失越小。也就是說辞色,增強(qiáng)向量是對該query或item所有可能匹配的正樣本信息的綜合表示骨宠。而在訓(xùn)練增強(qiáng)向量的過程中,需要使用stop gradient策略來凍結(jié)pupv相满。

2.3 Category Alignment

前面提到了兩個問題层亿,一個是特征交叉,另一個是類別不平衡問題立美。在美團(tuán)這種場景下匿又,類別是嚴(yán)重不平衡的,我們不能讓模型被主要類別帶偏了建蹄。同時也要讓較少的類別參與到模型的訓(xùn)練中碌更。論文提出了Category Alignment Loss,可以將數(shù)量較多的類別中學(xué)習(xí)到的信息遷移到數(shù)量較小的類別中洞慎。CAL計(jì)算主類別和其他類別的協(xié)方差矩陣二階矩痛单,降低類別間的差距:

關(guān)于cal,可以自己去看看相應(yīng)的論文

2.4 模型訓(xùn)練和損失函數(shù)

這部分就很簡單了劲腿,雙塔召回嘛旭绒,無非就是采樣+loss設(shè)計(jì)的問題:

三、實(shí)驗(yàn)結(jié)果


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市挥吵,隨后出現(xiàn)的幾起案子重父,更是在濱河造成了極大的恐慌,老刑警劉巖忽匈,帶你破解...
    沈念sama閱讀 222,000評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件房午,死亡現(xiàn)場離奇詭異,居然都是意外死亡丹允,警方通過查閱死者的電腦和手機(jī)郭厌,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,745評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來嫌松,“玉大人沪曙,你說我怎么就攤上這事奕污∥幔” “怎么了?”我有些...
    開封第一講書人閱讀 168,561評論 0 360
  • 文/不壞的土叔 我叫張陵碳默,是天一觀的道長贾陷。 經(jīng)常有香客問我,道長嘱根,這世上最難降的妖魔是什么髓废? 我笑而不...
    開封第一講書人閱讀 59,782評論 1 298
  • 正文 為了忘掉前任,我火速辦了婚禮该抒,結(jié)果婚禮上慌洪,老公的妹妹穿的比我還像新娘。我一直安慰自己凑保,他們只是感情好冈爹,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,798評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著欧引,像睡著了一般频伤。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上芝此,一...
    開封第一講書人閱讀 52,394評論 1 310
  • 那天憋肖,我揣著相機(jī)與錄音,去河邊找鬼婚苹。 笑死岸更,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的膊升。 我是一名探鬼主播坐慰,決...
    沈念sama閱讀 40,952評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了结胀?” 一聲冷哼從身側(cè)響起赞咙,我...
    開封第一講書人閱讀 39,852評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎糟港,沒想到半個月后攀操,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,409評論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡秸抚,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,483評論 3 341
  • 正文 我和宋清朗相戀三年速和,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片剥汤。...
    茶點(diǎn)故事閱讀 40,615評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡颠放,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出吭敢,到底是詐尸還是另有隱情碰凶,我是刑警寧澤,帶...
    沈念sama閱讀 36,303評論 5 350
  • 正文 年R本政府宣布鹿驼,位于F島的核電站欲低,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏畜晰。R本人自食惡果不足惜砾莱,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,979評論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望凄鼻。 院中可真熱鬧腊瑟,春花似錦、人聲如沸块蚌。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,470評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽匈子。三九已至河胎,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間虎敦,已是汗流浹背游岳。 一陣腳步聲響...
    開封第一講書人閱讀 33,571評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留其徙,地道東北人胚迫。 一個月前我還...
    沈念sama閱讀 49,041評論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像唾那,于是被迫代替她去往敵國和親访锻。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,630評論 2 359

推薦閱讀更多精彩內(nèi)容