今天繼續(xù)來(lái)介紹CIKM20上有關(guān)推薦系統(tǒng)的論文讨惩。本文介紹的是京東和百度的研究人員發(fā)表的有關(guān)在大規(guī)模電商推薦系統(tǒng)的多目標(biāo)排序上的工作产弹。論文將興趣建模剑勾、多任務(wù)學(xué)習(xí)量窘、偏置學(xué)習(xí)等幾部分進(jìn)行融合朗涩,提出了DMT模型(Deep Multifaceted Transformers),一起來(lái)看一下绑改。
1谢床、背景
推薦系統(tǒng)精排階段的模型多種多樣,包括樹(shù)模型厘线,基于神經(jīng)網(wǎng)絡(luò)的模型识腿,基于強(qiáng)化學(xué)習(xí)的模型等等官疲。在現(xiàn)實(shí)世界的大規(guī)模電商推薦系統(tǒng)中负敏,精排階段面臨以下幾方面的挑戰(zhàn):
1)多目標(biāo)排序:在電商場(chǎng)景下,對(duì)自然結(jié)果(非廣告)的排序往往不只按照點(diǎn)擊率苛谷,而是多個(gè)目標(biāo)的組合,如排序公式RS = a * CTR + b * CVR成箫。
2)多類型用戶行為:電商場(chǎng)景下用戶通常有多種類型的行為展箱,如點(diǎn)擊、加購(gòu)和下單蹬昌。不同類型的行為對(duì)于不同的目標(biāo)建模的作用是不同的混驰。當(dāng)前大多數(shù)的研究通常只考慮用戶點(diǎn)擊行為序列,如何有效地使用用戶不同多樣的行為類型進(jìn)行多目標(biāo)建模皂贩,仍是一個(gè)開(kāi)發(fā)話題栖榨。
3)有偏的用戶反饋:電商場(chǎng)景下,用戶的行為是存在偏置的明刷。最為常見(jiàn)的偏置為位置偏置(position bias)婴栽,展示位置越靠前的商品,具有更高的概率被用戶點(diǎn)擊辈末。而論文提出了另一種偏置愚争,叫做近鄰偏置(neighboring bias,小編暫且翻譯為近鄰偏置)挤聘,即一個(gè)商品是否被點(diǎn)擊轰枝,會(huì)受到其相鄰展示商品的影響,如下圖中國(guó)排在第一個(gè)位置的iphone 11檬洞,因?yàn)樗旁诹说谝晃恢美旮啵杂懈叩狞c(diǎn)擊概率,但是由于相鄰展示的有其他的iphones添怔,又會(huì)在一定程度上降低其被點(diǎn)擊的概率湾戳,如何建模和消除上述兩種偏置,也是值得探討的广料。
針對(duì)上述三方面的挑戰(zhàn)砾脑,論文融合了多任務(wù)學(xué)習(xí),多行為序列建模以及偏置學(xué)習(xí)艾杏,提出了DMT模型(Deep Multifaceted Transformers)韧衣,本文將在下一節(jié)進(jìn)行介紹。
2购桑、DMT模型介紹
首先來(lái)看一下DMT模型的整體結(jié)構(gòu):
可以看到畅铭,整體架構(gòu)可以拆解成Input and Embedding Layers、Deep Multifaceted Transformers Layer勃蜘、Multi-gate Mixture-of-Experts Layers和Bias Deep Neural Network硕噩。接下來(lái)對(duì)這幾部分進(jìn)行分別介紹。
2.1 Input and Embedding Layers
模型的輸入可以分為離散特征和連續(xù)特征兩大類缭贡。
離散特征
離散特征主要包括目標(biāo)商品特征炉擅,以及用戶多樣的行為序列中上品對(duì)應(yīng)的特征辉懒,序列包括用戶點(diǎn)擊序列Sc,用戶加購(gòu)序列Sa和用戶下單序列So谍失。目標(biāo)商品及用戶序列中的每個(gè)商品對(duì)應(yīng)的離散特征包括商品id眶俩、店鋪id、品牌id快鱼、品類id颠印,每個(gè)離散特征經(jīng)過(guò)embedding層轉(zhuǎn)換為對(duì)應(yīng)的embedding,再進(jìn)行拼接作為輸入攒巍。
連續(xù)特征
連續(xù)特征主要包含以下幾類:商品畫(huà)像特征如點(diǎn)擊數(shù)嗽仪,點(diǎn)擊率荒勇,轉(zhuǎn)化率統(tǒng)計(jì)特征柒莉;用戶畫(huà)像特征如購(gòu)買力指數(shù);用戶-商品匹配特征和交互特征如用戶在過(guò)去1天/3天/7天點(diǎn)擊過(guò)相同品類商品的次數(shù)沽翔。連續(xù)特征會(huì)進(jìn)行標(biāo)準(zhǔn)化處理兢孝。
2.2 Deep Multifaceted Transformers Layer
這一層主要是對(duì)用戶不同類型的行為序列進(jìn)行建模,對(duì)于點(diǎn)擊/加購(gòu)/下單三個(gè)行為序列仅偎,使用三個(gè)單獨(dú)的 Deep Interest Transformer進(jìn)行建模跨蟹。由于不同序列的行為數(shù)差距較大(用戶可能點(diǎn)擊次數(shù)很多,但很少有下單)橘沥,因此三個(gè)序列的長(zhǎng)度在論文中定義為:用戶過(guò)去7天內(nèi)最近點(diǎn)擊過(guò)的50個(gè)商品窗轩、用戶過(guò)去1年內(nèi)最近加購(gòu)和下單的10個(gè)商品。
Deep Interest Transformer的結(jié)構(gòu)如下:
其結(jié)構(gòu)與transformer基本一致座咆,這里使用的是完整的encoder-decoder結(jié)構(gòu)痢艺。而在過(guò)去的論文大都只使用encoder部分,如阿里的BST介陶,將用戶行為序列和目標(biāo)商品一起作為encoder部分的輸入堤舒。
transformer的具體計(jì)算過(guò)程本文就不再介紹了,主要講一下positional encoding哺呜。論文對(duì)比了兩種不同的positional encoding的方式舌缤,一種是使用sin-cos函數(shù),這樣每個(gè)位置的positional encoding是固定的某残,這也是原論文使用的方式国撵。另一種是對(duì)每一個(gè)位置賦予一個(gè)embedding,作為網(wǎng)絡(luò)參數(shù)進(jìn)行學(xué)習(xí)玻墅。實(shí)驗(yàn)的結(jié)果是第二種方式更加合適介牙。
當(dāng)然還有其他的建模方式,如使用時(shí)間戳離散化后對(duì)應(yīng)的embedding作為positional encoding椭豫。
在Deep Multifaceted Transformers Layer耻瑟,輸出主要包含三個(gè)旨指,分別是點(diǎn)擊/加購(gòu)/下單序列經(jīng)過(guò)Transformer后輸出的興趣向量。
2.3 Multi-gate Mixture-of-Experts Layers
前文已經(jīng)提到喳整,電商推薦系統(tǒng)往往需要預(yù)測(cè)多個(gè)目標(biāo)谆构,如CTR、CVR和GMV等框都。一種方式是使用多個(gè)單獨(dú)的模型進(jìn)行并行預(yù)估搬素,另一種方式是使用多任務(wù)學(xué)習(xí)同時(shí)輸出多個(gè)目標(biāo)的預(yù)估值。論文使用的多任務(wù)學(xué)習(xí)框架是MMOE魏保,MMOE層輸入包括Deep Multifaceted Transformers Layer得到的三個(gè)序列的興趣向量熬尺、目標(biāo)商品的embedding、連續(xù)特征標(biāo)準(zhǔn)化后的結(jié)果谓罗。第k個(gè)任務(wù)的輸出計(jì)作uk粱哼。
關(guān)于MMOE,可以參考本系列的第六十九篇檩咱,本文不在做詳細(xì)介紹揭措。
2.4 Bias Deep Neural Network
如前文所述,推薦系統(tǒng)中面臨的的偏置包含兩個(gè)方面刻蚯,位置偏置和近鄰偏置绊含。DMT使用單獨(dú)的Bias Deep Neural Network對(duì)偏置進(jìn)行建模。這一部分輸入的主要是一些bias feature炊汹。對(duì)于位置偏置躬充,輸入特征包括商品展示頁(yè)數(shù)和在該頁(yè)下的位置;對(duì)于近鄰偏置讨便,輸入特征是其近鄰的K個(gè)商品的品類充甚。不同的特征經(jīng)過(guò)embedding層轉(zhuǎn)換為對(duì)應(yīng)的embedding,然后經(jīng)過(guò)MLP得到輸出yb器钟。
2.5 Model Training and Prediction
以CTR和CVR兩個(gè)任務(wù)為例津坑,在模型訓(xùn)練階段,第k個(gè)任務(wù)的預(yù)測(cè)值yk計(jì)算如下:
第k個(gè)任務(wù)的損失Lk和整體的損失函數(shù)計(jì)算如下:
而在線上預(yù)測(cè)階段傲霸,不使用bias-net疆瑰,第k個(gè)任務(wù)的預(yù)測(cè)值為:
3、實(shí)驗(yàn)結(jié)果
最后來(lái)看一下實(shí)驗(yàn)結(jié)果:
好了昙啄,論文就介紹到這里穆役,感興趣的同學(xué)可以看一下原文~~,咱們下期再見(jiàn)梳凛。