1谢床、背景

推薦系統(tǒng)精排階段的模型多種多樣，包括樹(shù)模型厘线，基于神經(jīng)網(wǎng)絡(luò)的模型识腿，基于強(qiáng)化學(xué)習(xí)的模型等等官疲。在現(xiàn)實(shí)世界的大規(guī)模電商推薦系統(tǒng)中负敏，精排階段面臨以下幾方面的挑戰(zhàn)：

1）多目標(biāo)排序：在電商場(chǎng)景下，對(duì)自然結(jié)果（非廣告）的排序往往不只按照點(diǎn)擊率苛谷，而是多個(gè)目標(biāo)的組合，如排序公式RS = a * CTR + b * CVR成箫。

2）多類型用戶行為：電商場(chǎng)景下用戶通常有多種類型的行為展箱，如點(diǎn)擊、加購(gòu)和下單蹬昌。不同類型的行為對(duì)于不同的目標(biāo)建模的作用是不同的混驰。當(dāng)前大多數(shù)的研究通常只考慮用戶點(diǎn)擊行為序列，如何有效地使用用戶不同多樣的行為類型進(jìn)行多目標(biāo)建模皂贩，仍是一個(gè)開(kāi)發(fā)話題栖榨。

3）有偏的用戶反饋：電商場(chǎng)景下，用戶的行為是存在偏置的明刷。最為常見(jiàn)的偏置為位置偏置（position bias）婴栽，展示位置越靠前的商品，具有更高的概率被用戶點(diǎn)擊辈末。而論文提出了另一種偏置愚争，叫做近鄰偏置（neighboring bias，小編暫且翻譯為近鄰偏置）挤聘，即一個(gè)商品是否被點(diǎn)擊轰枝，會(huì)受到其相鄰展示商品的影響，如下圖中國(guó)排在第一個(gè)位置的iphone 11檬洞，因?yàn)樗旁诹说谝晃恢美旮啵杂懈叩狞c(diǎn)擊概率，但是由于相鄰展示的有其他的iphones添怔，又會(huì)在一定程度上降低其被點(diǎn)擊的概率湾戳，如何建模和消除上述兩種偏置，也是值得探討的广料。

針對(duì)上述三方面的挑戰(zhàn)砾脑，論文融合了多任務(wù)學(xué)習(xí)，多行為序列建模以及偏置學(xué)習(xí)艾杏，提出了DMT模型（Deep Multifaceted Transformers）韧衣，本文將在下一節(jié)進(jìn)行介紹。

2购桑、DMT模型介紹

首先來(lái)看一下DMT模型的整體結(jié)構(gòu)：

可以看到畅铭，整體架構(gòu)可以拆解成Input and Embedding Layers、Deep Multifaceted Transformers Layer勃蜘、Multi-gate Mixture-of-Experts Layers和Bias Deep Neural Network硕噩。接下來(lái)對(duì)這幾部分進(jìn)行分別介紹。

2.1 Input and Embedding Layers

模型的輸入可以分為離散特征和連續(xù)特征兩大類缭贡。

離散特征

離散特征主要包括目標(biāo)商品特征炉擅，以及用戶多樣的行為序列中上品對(duì)應(yīng)的特征辉懒，序列包括用戶點(diǎn)擊序列S_c，用戶加購(gòu)序列S_a和用戶下單序列S_o谍失。目標(biāo)商品及用戶序列中的每個(gè)商品對(duì)應(yīng)的離散特征包括商品id眶俩、店鋪id、品牌id快鱼、品類id颠印，每個(gè)離散特征經(jīng)過(guò)embedding層轉(zhuǎn)換為對(duì)應(yīng)的embedding，再進(jìn)行拼接作為輸入攒巍。

連續(xù)特征

連續(xù)特征主要包含以下幾類：商品畫(huà)像特征如點(diǎn)擊數(shù)嗽仪，點(diǎn)擊率荒勇，轉(zhuǎn)化率統(tǒng)計(jì)特征柒莉；用戶畫(huà)像特征如購(gòu)買力指數(shù)；用戶-商品匹配特征和交互特征如用戶在過(guò)去1天／3天／7天點(diǎn)擊過(guò)相同品類商品的次數(shù)沽翔。連續(xù)特征會(huì)進(jìn)行標(biāo)準(zhǔn)化處理兢孝。

2.2 Deep Multifaceted Transformers Layer

這一層主要是對(duì)用戶不同類型的行為序列進(jìn)行建模，對(duì)于點(diǎn)擊／加購(gòu)／下單三個(gè)行為序列仅偎，使用三個(gè)單獨(dú)的 Deep Interest Transformer進(jìn)行建模跨蟹。由于不同序列的行為數(shù)差距較大（用戶可能點(diǎn)擊次數(shù)很多，但很少有下單）橘沥，因此三個(gè)序列的長(zhǎng)度在論文中定義為：用戶過(guò)去7天內(nèi)最近點(diǎn)擊過(guò)的50個(gè)商品窗轩、用戶過(guò)去1年內(nèi)最近加購(gòu)和下單的10個(gè)商品。

Deep Interest Transformer的結(jié)構(gòu)如下：

其結(jié)構(gòu)與transformer基本一致座咆，這里使用的是完整的encoder-decoder結(jié)構(gòu)痢艺。而在過(guò)去的論文大都只使用encoder部分，如阿里的BST介陶，將用戶行為序列和目標(biāo)商品一起作為encoder部分的輸入堤舒。

transformer的具體計(jì)算過(guò)程本文就不再介紹了，主要講一下positional encoding哺呜。論文對(duì)比了兩種不同的positional encoding的方式舌缤，一種是使用sin-cos函數(shù)，這樣每個(gè)位置的positional encoding是固定的某残，這也是原論文使用的方式国撵。另一種是對(duì)每一個(gè)位置賦予一個(gè)embedding，作為網(wǎng)絡(luò)參數(shù)進(jìn)行學(xué)習(xí)玻墅。實(shí)驗(yàn)的結(jié)果是第二種方式更加合適介牙。

當(dāng)然還有其他的建模方式，如使用時(shí)間戳離散化后對(duì)應(yīng)的embedding作為positional encoding椭豫。

在Deep Multifaceted Transformers Layer耻瑟，輸出主要包含三個(gè)旨指，分別是點(diǎn)擊／加購(gòu)／下單序列經(jīng)過(guò)Transformer后輸出的興趣向量。

2.3 Multi-gate Mixture-of-Experts Layers

前文已經(jīng)提到喳整，電商推薦系統(tǒng)往往需要預(yù)測(cè)多個(gè)目標(biāo)谆构，如CTR、CVR和GMV等框都。一種方式是使用多個(gè)單獨(dú)的模型進(jìn)行并行預(yù)估搬素，另一種方式是使用多任務(wù)學(xué)習(xí)同時(shí)輸出多個(gè)目標(biāo)的預(yù)估值。論文使用的多任務(wù)學(xué)習(xí)框架是MMOE魏保，MMOE層輸入包括Deep Multifaceted Transformers Layer得到的三個(gè)序列的興趣向量熬尺、目標(biāo)商品的embedding、連續(xù)特征標(biāo)準(zhǔn)化后的結(jié)果谓罗。第k個(gè)任務(wù)的輸出計(jì)作u_k粱哼。

關(guān)于MMOE，可以參考本系列的第六十九篇檩咱，本文不在做詳細(xì)介紹揭措。

2.4 Bias Deep Neural Network

如前文所述，推薦系統(tǒng)中面臨的的偏置包含兩個(gè)方面刻蚯，位置偏置和近鄰偏置绊含。DMT使用單獨(dú)的Bias Deep Neural Network對(duì)偏置進(jìn)行建模。這一部分輸入的主要是一些bias feature炊汹。對(duì)于位置偏置躬充，輸入特征包括商品展示頁(yè)數(shù)和在該頁(yè)下的位置；對(duì)于近鄰偏置讨便，輸入特征是其近鄰的K個(gè)商品的品類充甚。不同的特征經(jīng)過(guò)embedding層轉(zhuǎn)換為對(duì)應(yīng)的embedding，然后經(jīng)過(guò)MLP得到輸出y_b器钟。

2.5 Model Training and Prediction

以CTR和CVR兩個(gè)任務(wù)為例津坑，在模型訓(xùn)練階段，第k個(gè)任務(wù)的預(yù)測(cè)值y_k計(jì)算如下：

第k個(gè)任務(wù)的損失L_k和整體的損失函數(shù)計(jì)算如下：

而在線上預(yù)測(cè)階段傲霸，不使用bias-net疆瑰，第k個(gè)任務(wù)的預(yù)測(cè)值為：

3、實(shí)驗(yàn)結(jié)果

最后來(lái)看一下實(shí)驗(yàn)結(jié)果：

好了昙啄，論文就介紹到這里穆役，感興趣的同學(xué)可以看一下原文～～，咱們下期再見(jiàn)梳凛。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末耿币，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子韧拒，更是在濱河造成了極大的恐慌淹接，老刑警劉巖十性，帶你破解...
沈念sama閱讀 217,542評(píng)論 6贊 504
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異塑悼，居然都是意外死亡劲适，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,822評(píng)論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門厢蒜，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)霞势，“玉大人，你說(shuō)我怎么就攤上這事斑鸦°倒保” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 163,912評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵巷屿，是天一觀的道長(zhǎng)固以。經(jīng)常有香客問(wèn)我，道長(zhǎng)攒庵，這世上最難降的妖魔是什么嘴纺？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,449評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任败晴，我火速辦了婚禮浓冒，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘尖坤。我一直安慰自己稳懒，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,500評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布慢味。她就那樣靜靜地躺著场梆，像睡著了一般。火紅的嫁衣襯著肌膚如雪纯路。梳的紋絲不亂的頭發(fā)上或油，一...
開(kāi)封第一講書(shū)人閱讀 51,370評(píng)論 1贊 302
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音驰唬，去河邊找鬼顶岸。笑死，一個(gè)胖子當(dāng)著我的面吹牛叫编，可吹牛的內(nèi)容都是我干的辖佣。我是一名探鬼主播，決...
沈念sama閱讀 40,193評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼搓逾，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼卷谈！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起霞篡，我...
開(kāi)封第一講書(shū)人閱讀 39,074評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤世蔗，失蹤者是張志新（化名）和其女友劉穎端逼，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體污淋，經(jīng)...
沈念sama閱讀 45,505評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡裳食，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,722評(píng)論 3贊 335
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了芙沥。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片诲祸。...
茶點(diǎn)故事閱讀 39,841評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖而昨，靈堂內(nèi)的尸體忽然破棺而出救氯，到底是詐尸還是另有隱情，我是刑警寧澤歌憨，帶...
沈念sama閱讀 35,569評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布着憨，位于F島的核電站，受9級(jí)特大地震影響务嫡，放射性物質(zhì)發(fā)生泄漏甲抖。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,168評(píng)論 3贊 328
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一心铃、第九天我趴在偏房一處隱蔽的房頂上張望准谚。院中可真熱鬧，春花似錦去扣、人聲如沸柱衔。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,783評(píng)論 0贊 22
一樁弒父案愉棱，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)唆铐。三九已至，卻和暖如春奔滑，著一層夾襖步出監(jiān)牢的瞬間艾岂，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,918評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工朋其，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留王浴，地道東北人。一個(gè)月前我還...
沈念sama閱讀 47,962評(píng)論 2贊 370
代替公主和親
正文我出身青樓令宿，卻偏偏與公主長(zhǎng)得像叼耙，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子粒没，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,781評(píng)論 2贊 354

推薦系統(tǒng)遇上深度學(xué)習(xí)(一零三)-[京東&百度]用于電商推薦系統(tǒng)多目標(biāo)排序的DMT模型