推薦系統(tǒng)遇上深度學(xué)習(xí)(一四二)-[微軟&復(fù)旦]CTR預(yù)估中的對比學(xué)習(xí)框架CL4CTR

今天分享的論文為《CL4CTR: A Contrastive Learning Framework for CTR Prediction》前普,從特征表示角度入手辈讶,將多種對比學(xué)習(xí)損失引入到CTR預(yù)估的模型訓(xùn)練中场航,一起來看一下九妈。

1硬爆、背景

主流的CTR預(yù)估模型大致可以分為兩類古瓤,一類是傳統(tǒng)的模型赢织,如邏輯回歸亮靴,F(xiàn)M,F(xiàn)FM等于置,這些模型僅可以建模低階的特征交互茧吊,另一類是基于深度學(xué)習(xí)的模型,如DeepFM八毯、wide&Deep等搓侄,這些模型可以建模高階的特征交互來提升模型的預(yù)估效果。對于深度學(xué)習(xí)類的CTR預(yù)估模型话速,大都基于三層的設(shè)計范式:Embedding層休讳、特征交互(FI)層和預(yù)估層。在這種設(shè)計范式下尿孔,絕大多數(shù)的工作針對特征交互層展開俊柔,如xDeepFM筹麸、DCN等,對于Embedding層的研究卻很少雏婶。但在實際訓(xùn)練過程中物赶,大多數(shù)CTR模型面臨的一個問題是:出現(xiàn)頻率高的特征對應(yīng)的Embedding會被充分學(xué)習(xí),出現(xiàn)次數(shù)低的特征對應(yīng)的Embedding無法被充分學(xué)習(xí)留晚,進一步導(dǎo)致模型的表現(xiàn)是次優(yōu)的酵紫。如在Frappe和ML-tag數(shù)據(jù)集中,可以看到明顯的“長尾”現(xiàn)象错维,如下圖所示:

當(dāng)然也有一些工作從特征表示的角度入手進行優(yōu)化奖地,在模型中引入了特征重要度模塊來增強其表示(如FEN,Duel-FEN)赋焕,但額外模塊的引入會帶來額外的學(xué)習(xí)參數(shù)以及線上推理耗時参歹,同時,這些模型僅通過監(jiān)督信號來優(yōu)化特征表示隆判,論文認為這也是遠遠不夠的犬庇。

因此,從特征表示優(yōu)化的角度出發(fā)侨嘀,針對現(xiàn)有模型的一些問題臭挽,將多種對比學(xué)習(xí)的損失引入到模型當(dāng)中,接下來對具體方法進行介紹咬腕。

2欢峰、CL4CTR介紹

論文提出了一種CTR預(yù)估中的對比學(xué)習(xí)框架CL4CTR,整體如下圖所示:

預(yù)估部分的內(nèi)容就不介紹了涨共,主要對三種對比學(xué)習(xí)損失進行介紹纽帖。

2.1 Contrastive Loss

這一部分引入了Contrastive Moudle,基于數(shù)據(jù)增強的思路煞赢,對樣本的embedding進行擾動抛计,構(gòu)造相似的正例樣本,相似的embedding在經(jīng)過相同的特征交互層和映射層之后照筑,得到的結(jié)果也應(yīng)該是相近的吹截。

對于embedding擾動的方式,論文提出了三種方法凝危,分別是隨機mask波俄,按特征mask,按維度mask蛾默,三種方式如下圖所示:

對于擾動后的樣本對懦铺,經(jīng)過特征交互層和映射層之后,希望其得到的向量表示越近越好支鸡,數(shù)學(xué)表示如下:

2.2 Feature Alignment And Field Uniformity Loss

為了確保高頻特征和低頻特征都能夠得到有效的學(xué)習(xí)冬念,受CV和NLP領(lǐng)域中的思路的啟發(fā)趁窃,通過引入正負樣本對,引入alignment和uniformity兩個約束來實現(xiàn)急前。針對CTR預(yù)估場景醒陆,本文將同一個field的特征類比為正樣本對,不同field的特征類比為負樣本對裆针,在這樣的假定下刨摩,F(xiàn)eature Alignment即來自相同域的embedding盡可能接近,F(xiàn)ield Uniformity即來自不同域的特征embedding盡可能遠世吨。數(shù)學(xué)表示如下:

其中澡刹,F(xiàn)表示field的個數(shù),f表示某一個特定的域耘婚,相似度計算采用cosine距離罢浇。

2.3 Multi-task Training

在引入上述三個對比學(xué)習(xí)損失后,模型的整體損失函數(shù)包含四部分:

首先边篮,模型沒有引入額外的參數(shù)己莺,因此不影響預(yù)測耗時奏甫;其次戈轿,通過引入Contrastive Loss,提升了embedding的表達能力阵子;最后思杯,引入最后一部分損失,保證長尾特征的embedding也能得到有效的學(xué)習(xí)挠进。

3色乾、實驗結(jié)果

最后來看下實驗結(jié)果,首先是與baseline模型的對比:

接下來論文進行了諸多消融實驗驗證模型的效果领突,首先是兼容性分析暖璧,將CL4CTR應(yīng)用于不同的base模型上,均取得了AUC的提升:

其次是Contrastive Loss中不同的數(shù)據(jù)增強方式君旦,針對不同的數(shù)據(jù)集和Base模型澎办,最優(yōu)的數(shù)據(jù)增強方式不同:

最后是loss function,引入三種對比學(xué)習(xí)損失時金砍,效果最優(yōu):

好了局蚀,論文就介紹到這里,整體來說論文要解決的問題十分明確恕稠,所采取的對比學(xué)習(xí)方法具有一定的借鑒意義~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末琅绅,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子鹅巍,更是在濱河造成了極大的恐慌千扶,老刑警劉巖料祠,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異澎羞,居然都是意外死亡术陶,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門煤痕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來梧宫,“玉大人,你說我怎么就攤上這事摆碉√料唬” “怎么了?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵巷帝,是天一觀的道長忌卤。 經(jīng)常有香客問我,道長楞泼,這世上最難降的妖魔是什么驰徊? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮堕阔,結(jié)果婚禮上棍厂,老公的妹妹穿的比我還像新娘。我一直安慰自己超陆,他們只是感情好牺弹,可當(dāng)我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著时呀,像睡著了一般张漂。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上谨娜,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天航攒,我揣著相機與錄音,去河邊找鬼趴梢。 笑死漠畜,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的垢油。 我是一名探鬼主播盆驹,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼滩愁!你這毒婦竟也來了躯喇?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎廉丽,沒想到半個月后倦微,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡正压,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年欣福,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片焦履。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡拓劝,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出嘉裤,到底是詐尸還是另有隱情郑临,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布屑宠,位于F島的核電站厢洞,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏典奉。R本人自食惡果不足惜躺翻,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望卫玖。 院中可真熱鬧公你,春花似錦、人聲如沸骇笔。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽笨触。三九已至,卻和暖如春雹舀,著一層夾襖步出監(jiān)牢的瞬間芦劣,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工说榆, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留虚吟,地道東北人。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓签财,卻偏偏與公主長得像串慰,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子唱蒸,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容