CVR深度預(yù)估模型ESMM:阿里是怎么做點(diǎn)擊后的轉(zhuǎn)化率預(yù)測的

本人微信公眾號為“推薦算法學(xué)習(xí)筆記”辐烂,定期推出經(jīng)典推薦算法文章让禀,歡迎關(guān)注钢拧。

這篇文章主要介紹阿里的ESMM模型《Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate》拯爽。

一.介紹

我們知道在電商網(wǎng)站培己,用戶行為遵循這樣的模式:展示->點(diǎn)擊->轉(zhuǎn)化(購買)碳蛋。假設(shè)我們要預(yù)測某個商品被點(diǎn)擊之后轉(zhuǎn)化(購買)的概率,那應(yīng)該怎么建模呢省咨。值得注意的是肃弟,這里的預(yù)測目標(biāo)是商品被點(diǎn)擊之后的轉(zhuǎn)化率,而不是轉(zhuǎn)化率零蓉,它們是有區(qū)別的笤受。一個商品它的點(diǎn)擊率很低,但是一旦被點(diǎn)擊之后敌蜂,用戶購買的概率可能非常高箩兽,我們要預(yù)測的目標(biāo)pCVR=p(conversion|click, impression)。

二.解決思路

方案一

把用戶點(diǎn)擊之后購買的商品作為正樣本章喉,把用戶點(diǎn)擊之后沒有購買的商品作為負(fù)樣本汗贫,然后放入到深度模型里面進(jìn)行訓(xùn)練

存在的問題

(1)用戶沒有點(diǎn)擊的商品沒有參與到訓(xùn)練當(dāng)中身坐,我們預(yù)測的時候是對所有的商品進(jìn)行預(yù)測,相當(dāng)于訓(xùn)練的時候只采樣了被點(diǎn)擊的商品芳绩,導(dǎo)致最終的模型對沒有點(diǎn)擊的商品表達(dá)不足掀亥。這也就是論文當(dāng)中所說的Sample selection bias problem。

(2)訓(xùn)練數(shù)據(jù)少妥色。跟做點(diǎn)擊預(yù)測的數(shù)據(jù)相比搪花,訓(xùn)練數(shù)據(jù)相比非常少,導(dǎo)致更難訓(xùn)練和容易o(hù)verfit嘹害。也就是論文所說的Data sparsity problem撮竿。


方案二

把用戶點(diǎn)擊之后購買的商品作為正樣本,把用戶沒有點(diǎn)擊或者點(diǎn)擊之后沒有購買的商品作為負(fù)樣本笔呀,然后放入到深度模型里面進(jìn)行訓(xùn)練

存在的問題

這樣訓(xùn)練出來的模型是CVR=p(conversion| impression)幢踏,而不是pCVR=p(conversion|click, impression)。它們是有區(qū)別的

方案三

訓(xùn)練一個轉(zhuǎn)化率預(yù)估模型许师,然后再訓(xùn)練一個點(diǎn)擊預(yù)測模型唯灵。再使用轉(zhuǎn)化率預(yù)估的結(jié)果除以點(diǎn)擊預(yù)測的結(jié)果猿涨。

存在問題

這個方案是可行的,但是這樣要訓(xùn)練兩個模型,有沒有辦法放到一個模型里面訓(xùn)練锋勺?

阿里提出的ESMM就可以解決以上幾點(diǎn)提到的問題

三.ESMM模型

假設(shè)X表示我們的feature space宫患,Y和Z分別表示用戶是否點(diǎn)擊和購買唁盏。我們的求解的問題可以表示為pCVR=p(z = 1|y = 1, x)绪钥。根據(jù)條件概率,可以得到以下的公式

假如我們可以預(yù)估出pCTCVR和pCTR云芦,那pCVR就可以通過以下公式求解出來

基于此公式俯逾,阿里提出了以下模型,如圖所示


可以看到左側(cè)就是我們要求解的目標(biāo)pCVR舅逸,通過引入右側(cè)的兩個輔助任務(wù)pCTCVR和pCTR桌肴,將我們的目標(biāo)pCVR轉(zhuǎn)化成深度模型的一個神經(jīng)元,并共享輸入feature的embedding空間琉历。這樣识脆,就可以利用到我們點(diǎn)擊和不點(diǎn)擊的所有訓(xùn)練樣本,緩解我們樣本偏差和樣本稀疏的問題善已,達(dá)到更好的訓(xùn)練效果灼捂。

損失函數(shù)包含兩個部分,CTR和CTCVR换团,如下圖所示


四.總結(jié)

ESMM巧妙的通過兩個輔助任務(wù)對pCVR進(jìn)行求解悉稠,是多任務(wù)學(xué)習(xí)的典范。以上就是ESMM的所有內(nèi)容艘包,如果有問題的猛,歡迎和我交流耀盗。

本人微信公眾號為“推薦算法學(xué)習(xí)筆記”,定期推出經(jīng)典推薦算法文章卦尊,歡迎關(guān)注叛拷。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市岂却,隨后出現(xiàn)的幾起案子忿薇,更是在濱河造成了極大的恐慌,老刑警劉巖躏哩,帶你破解...
    沈念sama閱讀 212,816評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件署浩,死亡現(xiàn)場離奇詭異,居然都是意外死亡扫尺,警方通過查閱死者的電腦和手機(jī)筋栋,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,729評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來正驻,“玉大人弊攘,你說我怎么就攤上這事」檬铮” “怎么了襟交?”我有些...
    開封第一講書人閱讀 158,300評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長渣磷。 經(jīng)常有香客問我,道長授瘦,這世上最難降的妖魔是什么醋界? 我笑而不...
    開封第一講書人閱讀 56,780評論 1 285
  • 正文 為了忘掉前任,我火速辦了婚禮提完,結(jié)果婚禮上形纺,老公的妹妹穿的比我還像新娘。我一直安慰自己徒欣,他們只是感情好逐样,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,890評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著打肝,像睡著了一般脂新。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上粗梭,一...
    開封第一講書人閱讀 50,084評論 1 291
  • 那天争便,我揣著相機(jī)與錄音,去河邊找鬼断医。 笑死滞乙,一個胖子當(dāng)著我的面吹牛奏纪,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播斩启,決...
    沈念sama閱讀 39,151評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼序调,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了兔簇?” 一聲冷哼從身側(cè)響起发绢,我...
    開封第一講書人閱讀 37,912評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎男韧,沒想到半個月后朴摊,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,355評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡此虑,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,666評論 2 327
  • 正文 我和宋清朗相戀三年甚纲,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片朦前。...
    茶點(diǎn)故事閱讀 38,809評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡介杆,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出韭寸,到底是詐尸還是另有隱情春哨,我是刑警寧澤,帶...
    沈念sama閱讀 34,504評論 4 334
  • 正文 年R本政府宣布恩伺,位于F島的核電站赴背,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏晶渠。R本人自食惡果不足惜凰荚,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,150評論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望褒脯。 院中可真熱鬧便瑟,春花似錦、人聲如沸番川。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽颁督。三九已至践啄,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間沉御,已是汗流浹背往核。 一陣腳步聲響...
    開封第一講書人閱讀 32,121評論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留嚷节,地道東北人聂儒。 一個月前我還...
    沈念sama閱讀 46,628評論 2 362
  • 正文 我出身青樓虎锚,卻偏偏與公主長得像,于是被迫代替她去往敵國和親衩婚。 傳聞我的和親對象是個殘疾皇子窜护,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,724評論 2 351

推薦閱讀更多精彩內(nèi)容