推薦系統(tǒng)遇上深度學(xué)習(xí)(一零零)-[阿里]深度多興趣網(wǎng)絡(luò)DMIN

終于寫(xiě)到100篇了稼病,算是一個(gè)小里程碑,但絕不是終點(diǎn)掖鱼!后面還會(huì)有200然走、300....,希望大家能夠一直關(guān)注本專(zhuān)欄以及公眾號(hào)“小小挖掘機(jī)”戏挡,小編會(huì)繼續(xù)加油的芍瑞!

今天介紹的是阿里在CIKM20上發(fā)表的一篇文章,算是與DIN褐墅、DIEN一脈相承的一篇文章吧拆檬,論文提出了深度多興趣網(wǎng)絡(luò)來(lái)提升點(diǎn)擊率預(yù)估的效果,文章標(biāo)題為《Deep Multi-Interest Network for Click-through Rate Prediction》妥凳,論文下載地址為:https://dl.acm.org/doi/pdf/10.1145/3340531.3412092竟贯。

1、背景

阿里對(duì)于從用戶歷史行為序列中抽取用戶興趣的研究有很多逝钥,比如DIN屑那,首次提出使用attention機(jī)制建模用戶歷史行為序列中item和目標(biāo)item的相關(guān)性,來(lái)抽取對(duì)應(yīng)的用戶興趣,但其忽略了行為之間發(fā)生的先后順序持际;DIEN使用GRU單元沃琅,來(lái)建模用戶興趣的演進(jìn)過(guò)程;DSIN將用戶行為切分成不同的session选酗,使用自注意力機(jī)制建模不同session中的多樣興趣阵难。

用戶在一個(gè)時(shí)間點(diǎn)的興趣是多樣的,本文進(jìn)一步提出了深度多興趣網(wǎng)絡(luò)(Deep Multi-Interest Network 芒填、以下簡(jiǎn)稱DMIN)來(lái)提取用戶多樣化的興趣呜叫。一起來(lái)看一下。

2殿衰、DMIN介紹

DMIN的整體架構(gòu)如下:

可以看到朱庆,主要分為Embedding layer、Behavior Refiner Layer 和Multi-Interest Extractor Layer闷祥。接下來(lái)對(duì)這幾部分分別進(jìn)行介紹娱颊。

2.1 Embedding layer

網(wǎng)絡(luò)輸入的特征主要包括四部分,用戶畫(huà)像特征凯砍、用戶歷史行為特征箱硕,上下文特征和目標(biāo)item特征。每一個(gè)特征可以表示成一個(gè)one-hot向量悟衩,并通過(guò)embedding層轉(zhuǎn)換成對(duì)應(yīng)的embedding向量剧罩。

轉(zhuǎn)換后,用戶畫(huà)像特征座泳、用戶歷史行為特征惠昔,上下文特征和目標(biāo)item特征分別用xu,xb,xc,xt表示,其中xb={e1,e2,...,eT}挑势。

2.2 Behavior Refiner Layer

接下來(lái)镇防,通過(guò)multi-head attention對(duì)用戶歷史行為序列表示進(jìn)行提煉(refine這里暫且翻譯為提煉,個(gè)人感覺(jué)可以理解為對(duì)item對(duì)應(yīng)的興趣進(jìn)行初步提瘸北ァ)来氧。計(jì)算如下:

另外,受DIEN的啟發(fā)香拉,論文還在這里加入了輔助loss饲漾,使用t時(shí)刻得到的向量zt,去預(yù)測(cè)t+1時(shí)刻用戶的行為et+1缕溉,方式跟DIEN類(lèi)似考传,也需要進(jìn)行一定的負(fù)采樣。

2.3 Multi-Interest Extractor Layer

接下來(lái)就是對(duì)用戶多興趣的抽取证鸥,首先是一層multi-head self-attention僚楞,假設(shè)head的數(shù)量是HE勤晚,那么行為序列中每一個(gè)item在每一個(gè)head中,都有一個(gè)對(duì)應(yīng)的向量泉褐,共有HE個(gè)赐写。

接下來(lái),對(duì)于每一個(gè)head膜赃,都計(jì)算得到一個(gè)用戶的興趣表示挺邀,共計(jì)HE,其中第h個(gè)興趣計(jì)算如下:

其中跳座,Ijh代表第h個(gè)head中端铛,第j個(gè)item的向量表示,pj代表第j個(gè)item的position encoding疲眷,xt代表target item的向量表示禾蚕,可以看到,計(jì)算過(guò)程與DIN類(lèi)似狂丝,只是在DIN的基礎(chǔ)上换淆,對(duì)行為序列中的每一個(gè)item增加了對(duì)應(yīng)的position encoding,將行為序列發(fā)生的時(shí)間因素考慮了進(jìn)去几颜。position encoding的計(jì)算倍试,從前幾篇阿里論文的經(jīng)驗(yàn)來(lái)看,應(yīng)該是行為發(fā)生時(shí)間距當(dāng)前時(shí)間的時(shí)間差離散化后的結(jié)果蛋哭。

2.4 MLP層及損失函數(shù)

接下來(lái)县习,將得到的HE個(gè)興趣向量表示、用戶畫(huà)像向量表示具壮、上下文向量表示以及target item向量表示進(jìn)行拼接准颓,輸入到多層全連接神經(jīng)網(wǎng)絡(luò)中哈蝇,得到最終的輸出棺妓,損失函數(shù)包含兩部分,分別是logloss以及上文提到的輔助損失:

3炮赦、實(shí)驗(yàn)結(jié)果

最后簡(jiǎn)單看下實(shí)驗(yàn)結(jié)果怜跑,本文提出的DMIN模型,無(wú)論是在公開(kāi)數(shù)據(jù)集還是阿里內(nèi)部數(shù)據(jù)集上吠勘,都取得了不錯(cuò)的離線實(shí)驗(yàn)效果:

好了性芬,本文就到這里了,感興趣的小伙伴可以找到原文進(jìn)行閱讀喲~~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末剧防,一起剝皮案震驚了整個(gè)濱河市植锉,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌峭拘,老刑警劉巖俊庇,帶你破解...
    沈念sama閱讀 217,734評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件狮暑,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡辉饱,警方通過(guò)查閱死者的電腦和手機(jī)搬男,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)彭沼,“玉大人缔逛,你說(shuō)我怎么就攤上這事⌒栈螅” “怎么了褐奴?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,133評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)挺益。 經(jīng)常有香客問(wèn)我歉糜,道長(zhǎng),這世上最難降的妖魔是什么望众? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,532評(píng)論 1 293
  • 正文 為了忘掉前任匪补,我火速辦了婚禮,結(jié)果婚禮上烂翰,老公的妹妹穿的比我還像新娘夯缺。我一直安慰自己,他們只是感情好甘耿,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,585評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布踊兜。 她就那樣靜靜地躺著,像睡著了一般佳恬。 火紅的嫁衣襯著肌膚如雪捏境。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,462評(píng)論 1 302
  • 那天毁葱,我揣著相機(jī)與錄音垫言,去河邊找鬼。 笑死倾剿,一個(gè)胖子當(dāng)著我的面吹牛筷频,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播前痘,決...
    沈念sama閱讀 40,262評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼凛捏,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了芹缔?” 一聲冷哼從身側(cè)響起坯癣,我...
    開(kāi)封第一講書(shū)人閱讀 39,153評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎最欠,沒(méi)想到半個(gè)月后示罗,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體蓬网,經(jīng)...
    沈念sama閱讀 45,587評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,792評(píng)論 3 336
  • 正文 我和宋清朗相戀三年鹉勒,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了帆锋。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,919評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡禽额,死狀恐怖锯厢,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情脯倒,我是刑警寧澤实辑,帶...
    沈念sama閱讀 35,635評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站藻丢,受9級(jí)特大地震影響剪撬,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜悠反,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,237評(píng)論 3 329
  • 文/蒙蒙 一残黑、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧斋否,春花似錦梨水、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,855評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至旦委,卻和暖如春奇徒,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背缨硝。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,983評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工摩钙, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人追葡。 一個(gè)月前我還...
    沈念sama閱讀 48,048評(píng)論 3 370
  • 正文 我出身青樓腺律,卻偏偏與公主長(zhǎng)得像奕短,于是被迫代替她去往敵國(guó)和親宜肉。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,864評(píng)論 2 354