推薦系統(tǒng)遇上深度學(xué)習(xí)(一零三)-[京東&百度]用于電商推薦系統(tǒng)多目標(biāo)排序的DMT模型

今天繼續(xù)來(lái)介紹CIKM20上有關(guān)推薦系統(tǒng)的論文讨惩。本文介紹的是京東和百度的研究人員發(fā)表的有關(guān)在大規(guī)模電商推薦系統(tǒng)的多目標(biāo)排序上的工作产弹。論文將興趣建模剑勾、多任務(wù)學(xué)習(xí)量窘、偏置學(xué)習(xí)等幾部分進(jìn)行融合朗涩,提出了DMT模型(Deep Multifaceted Transformers),一起來(lái)看一下绑改。

1谢床、背景

推薦系統(tǒng)精排階段的模型多種多樣,包括樹(shù)模型厘线,基于神經(jīng)網(wǎng)絡(luò)的模型识腿,基于強(qiáng)化學(xué)習(xí)的模型等等官疲。在現(xiàn)實(shí)世界的大規(guī)模電商推薦系統(tǒng)中负敏,精排階段面臨以下幾方面的挑戰(zhàn):

1)多目標(biāo)排序:在電商場(chǎng)景下,對(duì)自然結(jié)果(非廣告)的排序往往不只按照點(diǎn)擊率苛谷,而是多個(gè)目標(biāo)的組合,如排序公式RS = a * CTR + b * CVR成箫。

2)多類型用戶行為:電商場(chǎng)景下用戶通常有多種類型的行為展箱,如點(diǎn)擊、加購(gòu)和下單蹬昌。不同類型的行為對(duì)于不同的目標(biāo)建模的作用是不同的混驰。當(dāng)前大多數(shù)的研究通常只考慮用戶點(diǎn)擊行為序列,如何有效地使用用戶不同多樣的行為類型進(jìn)行多目標(biāo)建模皂贩,仍是一個(gè)開(kāi)發(fā)話題栖榨。

3)有偏的用戶反饋:電商場(chǎng)景下,用戶的行為是存在偏置的明刷。最為常見(jiàn)的偏置為位置偏置(position bias)婴栽,展示位置越靠前的商品,具有更高的概率被用戶點(diǎn)擊辈末。而論文提出了另一種偏置愚争,叫做近鄰偏置(neighboring bias,小編暫且翻譯為近鄰偏置)挤聘,即一個(gè)商品是否被點(diǎn)擊轰枝,會(huì)受到其相鄰展示商品的影響,如下圖中國(guó)排在第一個(gè)位置的iphone 11檬洞,因?yàn)樗旁诹说谝晃恢美旮啵杂懈叩狞c(diǎn)擊概率,但是由于相鄰展示的有其他的iphones添怔,又會(huì)在一定程度上降低其被點(diǎn)擊的概率湾戳,如何建模和消除上述兩種偏置,也是值得探討的广料。

針對(duì)上述三方面的挑戰(zhàn)砾脑,論文融合了多任務(wù)學(xué)習(xí),多行為序列建模以及偏置學(xué)習(xí)艾杏,提出了DMT模型(Deep Multifaceted Transformers)韧衣,本文將在下一節(jié)進(jìn)行介紹。

2购桑、DMT模型介紹

首先來(lái)看一下DMT模型的整體結(jié)構(gòu):

可以看到畅铭,整體架構(gòu)可以拆解成Input and Embedding Layers、Deep Multifaceted Transformers Layer勃蜘、Multi-gate Mixture-of-Experts Layers和Bias Deep Neural Network硕噩。接下來(lái)對(duì)這幾部分進(jìn)行分別介紹。

2.1 Input and Embedding Layers

模型的輸入可以分為離散特征和連續(xù)特征兩大類缭贡。

離散特征

離散特征主要包括目標(biāo)商品特征炉擅,以及用戶多樣的行為序列中上品對(duì)應(yīng)的特征辉懒,序列包括用戶點(diǎn)擊序列Sc,用戶加購(gòu)序列Sa和用戶下單序列So谍失。目標(biāo)商品及用戶序列中的每個(gè)商品對(duì)應(yīng)的離散特征包括商品id眶俩、店鋪id、品牌id快鱼、品類id颠印,每個(gè)離散特征經(jīng)過(guò)embedding層轉(zhuǎn)換為對(duì)應(yīng)的embedding,再進(jìn)行拼接作為輸入攒巍。

連續(xù)特征

連續(xù)特征主要包含以下幾類:商品畫(huà)像特征如點(diǎn)擊數(shù)嗽仪,點(diǎn)擊率荒勇,轉(zhuǎn)化率統(tǒng)計(jì)特征柒莉;用戶畫(huà)像特征如購(gòu)買力指數(shù);用戶-商品匹配特征和交互特征如用戶在過(guò)去1天/3天/7天點(diǎn)擊過(guò)相同品類商品的次數(shù)沽翔。連續(xù)特征會(huì)進(jìn)行標(biāo)準(zhǔn)化處理兢孝。

2.2 Deep Multifaceted Transformers Layer

這一層主要是對(duì)用戶不同類型的行為序列進(jìn)行建模,對(duì)于點(diǎn)擊/加購(gòu)/下單三個(gè)行為序列仅偎,使用三個(gè)單獨(dú)的 Deep Interest Transformer進(jìn)行建模跨蟹。由于不同序列的行為數(shù)差距較大(用戶可能點(diǎn)擊次數(shù)很多,但很少有下單)橘沥,因此三個(gè)序列的長(zhǎng)度在論文中定義為:用戶過(guò)去7天內(nèi)最近點(diǎn)擊過(guò)的50個(gè)商品窗轩、用戶過(guò)去1年內(nèi)最近加購(gòu)和下單的10個(gè)商品。

Deep Interest Transformer的結(jié)構(gòu)如下:

其結(jié)構(gòu)與transformer基本一致座咆,這里使用的是完整的encoder-decoder結(jié)構(gòu)痢艺。而在過(guò)去的論文大都只使用encoder部分,如阿里的BST介陶,將用戶行為序列和目標(biāo)商品一起作為encoder部分的輸入堤舒。

transformer的具體計(jì)算過(guò)程本文就不再介紹了,主要講一下positional encoding哺呜。論文對(duì)比了兩種不同的positional encoding的方式舌缤,一種是使用sin-cos函數(shù),這樣每個(gè)位置的positional encoding是固定的某残,這也是原論文使用的方式国撵。另一種是對(duì)每一個(gè)位置賦予一個(gè)embedding,作為網(wǎng)絡(luò)參數(shù)進(jìn)行學(xué)習(xí)玻墅。實(shí)驗(yàn)的結(jié)果是第二種方式更加合適介牙。

當(dāng)然還有其他的建模方式,如使用時(shí)間戳離散化后對(duì)應(yīng)的embedding作為positional encoding椭豫。

在Deep Multifaceted Transformers Layer耻瑟,輸出主要包含三個(gè)旨指,分別是點(diǎn)擊/加購(gòu)/下單序列經(jīng)過(guò)Transformer后輸出的興趣向量。

2.3 Multi-gate Mixture-of-Experts Layers

前文已經(jīng)提到喳整,電商推薦系統(tǒng)往往需要預(yù)測(cè)多個(gè)目標(biāo)谆构,如CTR、CVR和GMV等框都。一種方式是使用多個(gè)單獨(dú)的模型進(jìn)行并行預(yù)估搬素,另一種方式是使用多任務(wù)學(xué)習(xí)同時(shí)輸出多個(gè)目標(biāo)的預(yù)估值。論文使用的多任務(wù)學(xué)習(xí)框架是MMOE魏保,MMOE層輸入包括Deep Multifaceted Transformers Layer得到的三個(gè)序列的興趣向量熬尺、目標(biāo)商品的embedding、連續(xù)特征標(biāo)準(zhǔn)化后的結(jié)果谓罗。第k個(gè)任務(wù)的輸出計(jì)作uk粱哼。

關(guān)于MMOE,可以參考本系列的第六十九篇檩咱,本文不在做詳細(xì)介紹揭措。

2.4 Bias Deep Neural Network

如前文所述,推薦系統(tǒng)中面臨的的偏置包含兩個(gè)方面刻蚯,位置偏置和近鄰偏置绊含。DMT使用單獨(dú)的Bias Deep Neural Network對(duì)偏置進(jìn)行建模。這一部分輸入的主要是一些bias feature炊汹。對(duì)于位置偏置躬充,輸入特征包括商品展示頁(yè)數(shù)和在該頁(yè)下的位置;對(duì)于近鄰偏置讨便,輸入特征是其近鄰的K個(gè)商品的品類充甚。不同的特征經(jīng)過(guò)embedding層轉(zhuǎn)換為對(duì)應(yīng)的embedding,然后經(jīng)過(guò)MLP得到輸出yb器钟。

2.5 Model Training and Prediction

以CTR和CVR兩個(gè)任務(wù)為例津坑,在模型訓(xùn)練階段,第k個(gè)任務(wù)的預(yù)測(cè)值yk計(jì)算如下:

第k個(gè)任務(wù)的損失Lk和整體的損失函數(shù)計(jì)算如下:

而在線上預(yù)測(cè)階段傲霸,不使用bias-net疆瑰,第k個(gè)任務(wù)的預(yù)測(cè)值為:

3、實(shí)驗(yàn)結(jié)果

最后來(lái)看一下實(shí)驗(yàn)結(jié)果:

好了昙啄,論文就介紹到這里穆役,感興趣的同學(xué)可以看一下原文~~,咱們下期再見(jiàn)梳凛。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末耿币,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子韧拒,更是在濱河造成了極大的恐慌淹接,老刑警劉巖十性,帶你破解...
    沈念sama閱讀 217,542評(píng)論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異塑悼,居然都是意外死亡劲适,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門厢蒜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)霞势,“玉大人,你說(shuō)我怎么就攤上這事斑鸦°倒保” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,912評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵巷屿,是天一觀的道長(zhǎng)固以。 經(jīng)常有香客問(wèn)我,道長(zhǎng)攒庵,這世上最難降的妖魔是什么嘴纺? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,449評(píng)論 1 293
  • 正文 為了忘掉前任败晴,我火速辦了婚禮浓冒,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘尖坤。我一直安慰自己稳懒,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,500評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布慢味。 她就那樣靜靜地躺著场梆,像睡著了一般。 火紅的嫁衣襯著肌膚如雪纯路。 梳的紋絲不亂的頭發(fā)上或油,一...
    開(kāi)封第一講書(shū)人閱讀 51,370評(píng)論 1 302
  • 那天,我揣著相機(jī)與錄音驰唬,去河邊找鬼顶岸。 笑死,一個(gè)胖子當(dāng)著我的面吹牛叫编,可吹牛的內(nèi)容都是我干的辖佣。 我是一名探鬼主播,決...
    沈念sama閱讀 40,193評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼搓逾,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼卷谈!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起霞篡,我...
    開(kāi)封第一講書(shū)人閱讀 39,074評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤世蔗,失蹤者是張志新(化名)和其女友劉穎端逼,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體污淋,經(jīng)...
    沈念sama閱讀 45,505評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡裳食,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,722評(píng)論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了芙沥。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片诲祸。...
    茶點(diǎn)故事閱讀 39,841評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖而昨,靈堂內(nèi)的尸體忽然破棺而出救氯,到底是詐尸還是另有隱情,我是刑警寧澤歌憨,帶...
    沈念sama閱讀 35,569評(píng)論 5 345
  • 正文 年R本政府宣布着憨,位于F島的核電站,受9級(jí)特大地震影響务嫡,放射性物質(zhì)發(fā)生泄漏甲抖。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,168評(píng)論 3 328
  • 文/蒙蒙 一心铃、第九天 我趴在偏房一處隱蔽的房頂上張望准谚。 院中可真熱鬧,春花似錦去扣、人聲如沸柱衔。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,783評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)唆铐。三九已至,卻和暖如春奔滑,著一層夾襖步出監(jiān)牢的瞬間艾岂,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,918評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工朋其, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留王浴,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,962評(píng)論 2 370
  • 正文 我出身青樓令宿,卻偏偏與公主長(zhǎng)得像叼耙,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子粒没,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,781評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容