1丘逸、背景

排序階段是推薦系統(tǒng)中比較重要的一環(huán)单鹿，排序的質量直接影響了用戶的體驗以及平臺的收益。排序算法整體可分為point-wise深纲、pair-wise和list-wise羞反。出于性能上的考慮，一般采用point-wise的方法囤萤，即對每一個候選物品給出一個評分，基于評分進行排序是趴。這樣的做法僅僅考慮了用戶和物品之間的關系涛舍，而沒有考慮排序列表中物品之間的關系。而pair-wise和list-wise的方法盡管將物品對或者物品列表作為整體輸入唆途，但也僅僅是盡可能優(yōu)化損失函數(shù)富雅，而并沒有從特征空間上顯式建模物品間的相互影響掸驱。（文中的這句話沒有太明白）

一些文章通過建模物品之間的相互影響來對排序階段給出的排序結果進行微調，這種做法叫做重排序（Re-ranking）没佑。主流的方法是基于RNN的重排序毕贼。但是RNN對于建模物品之間的影響有一定的缺陷，如果兩個物品相隔較遠蛤奢，它們的相關性并不能很好的刻畫鬼癣。

因此本文提出了一種基于Transformer的重排序結構，相較于RNN啤贩，其優(yōu)勢主要體現(xiàn)在兩個方面：
1）兩個物品的距離不會影響其相關性的計算
2）Transformer是并行計算待秃，編碼效率相較于RNN更為高效（RNN一個時刻只能輸入一個物品，相當于是串行計算痹屹，而Transformer可以同時輸入所有物品章郁，是并行計算）

除了使用Transformer之外，本文還有一個值得借鑒的地方就是將用戶特征加入了Transformer中志衍，使得重排序更加個性化暖庄。接下來就一起看一下阿里是如何進行個性化重排序的。

2楼肪、模型介紹

2.1 整體介紹

重排序的整體框架如下圖所示：

主要分為三個部分培廓，輸入層、編碼層和輸出層淹辞。文中用到的一些符號定義如下：

2.2 輸入層

首先医舆，經(jīng)過排序階段，我們得到了固定長度的列表S=[i₁,i₂,...,i_n]象缀，每個物品對應一個特征向量x_i蔬将，長度為d_feature，此時輸入計作E央星。除此之外霞怀，輸入層還包含兩個部分。

個性化向量Personalized Vector (PV)：用戶和每一個物品之間都會計算一個個性化向量pv_i作為輸入莉给，個性化向量通過如下的預訓練模型得到：

該模型是一個二分類模型毙石，取最后一個layer的輸出作為個性化向量pv_i。

加入個性化向量之后颓遏，輸入矩陣E'為：

位置編碼信息Position Embedding (PE)：與Transformer中固定的編碼信息不同徐矩，這里的位置編碼信息是可以學習，位置編碼矩陣和E'大小相同叁幢，計作PE滤灯，此時模型的輸入E''為：

在得到E''之后，經(jīng)過一個單層的前向網(wǎng)絡來進行一定的轉換：

上圖中等式右邊的E應該是E''吧，感覺打錯了鳞骤。

2.3 編碼層

編碼層是Transformer結構：

有關Transformer窒百，我們之前有篇文章詳細介紹過，這里就不再贅述豫尽，大家可以參考：http://www.reibang.com/p/2b0a5541a17c

2.4 輸出層

假設第N_x個Transformer encoder block的輸出為F^(N_x)篙梢，通過一層全連接神經(jīng)網(wǎng)絡和softmax層得到每個物品的重排序得分score(i)。

并基于交叉熵損失函數(shù)來進行模型參數(shù)的更新：

3美旧、實驗結果

文中使用Precision@k和MAP@k 作為評價指標渤滞，兩個指標的計算方式如下：

有關推薦系統(tǒng)的評價指標，可以看本系列的第十六篇文章：http://www.reibang.com/p/665f9f168eff

3.1 線下實驗結果

首先陈症，在Yhaoo Letor數(shù)據(jù)集上使用兩個模型得到的最初推薦結果蔼水，分別使用不同的模型進行重排序，實驗結果如下：

接下來录肯，分析了不同的模型結構所對應的實驗結果：

最后趴腋，使用真實的電商數(shù)據(jù)集進行試驗，結果如下：

3.2 線上A／B實驗結果

線上使用了三個模型進行A／B實驗论咏，實驗的評價指標包括PV优炬、IPV、CTR和GMV厅贪。PV指24小時內店鋪內所有頁面的瀏覽總量蠢护，可累加。IPV指點擊進入寶貝詳情頁的次數(shù)养涮。如果用戶看的越多葵硕、點擊次數(shù)越多，也可以一定程度上表示模型排序結果更好贯吓。

線上實驗結果如下：

4懈凹、總結

這篇文章主要介紹通過Transformer對排序結果進行重排序。個人感覺比較創(chuàng)新的點在于如何將Transformer和用戶特征進行結合悄谐，并提出了一種預訓練的模型來得到用戶的個性化向量介评。

但文中并沒有給出直接將這個模型應用于排序階段的效果如何，這一點也是我個人比較好奇的地方爬舰，感覺這個模型直接用在排序階段也可以得到比較好的結果们陆，哈哈。

本文介紹就到這列情屹，可能我的理解還有不到位的地方坪仇，歡迎大家一起討論對這篇文章的理解~

最后編輯于：2020.10.02 21:06:37

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市垃你，隨后出現(xiàn)的幾起案子椅文，更是在濱河造成了極大的恐慌颈墅，老刑警劉巖，帶你破解...
沈念sama閱讀 216,651評論 6贊 501
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件雾袱，死亡現(xiàn)場離奇詭異，居然都是意外死亡官还，警方通過查閱死者的電腦和手機芹橡，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,468評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來望伦，“玉大人林说，你說我怎么就攤上這事⊥蜕。” “怎么了腿箩？”我有些...
開封第一講書人閱讀 162,931評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長劣摇。經(jīng)常有香客問我珠移，道長，這世上最難降的妖魔是什么末融？我笑而不...
開封第一講書人閱讀 58,218評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任钧惧，我火速辦了婚禮，結果婚禮上勾习，老公的妹妹穿的比我還像新娘浓瞪。我一直安慰自己，他們只是感情好巧婶，可當我...
茶點故事閱讀 67,234評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布乾颁。她就那樣靜靜地躺著，像睡著了一般艺栈。火紅的嫁衣襯著肌膚如雪英岭。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,198評論 1贊 299
城市分裂傳說
那天眼滤，我揣著相機與錄音巴席，去河邊找鬼。笑死诅需，一個胖子當著我的面吹牛漾唉，可吹牛的內容都是我干的。我是一名探鬼主播堰塌，決...
沈念sama閱讀 40,084評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼赵刑，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了场刑？” 一聲冷哼從身側響起般此，我...
開封第一講書人閱讀 38,926評論 0贊 274
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤蚪战，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后铐懊，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體邀桑，經(jīng)...
沈念sama閱讀 45,341評論 1贊 311
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,563評論 2贊 333
?白月光啟示錄
正文我和宋清朗相戀三年科乎，在試婚紗的時候發(fā)現(xiàn)自己被綠了壁畸。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 39,731評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡茅茂，死狀恐怖捏萍，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情空闲，我是刑警寧澤令杈，帶...
沈念sama閱讀 35,430評論 5贊 343
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站碴倾，受9級特大地震影響逗噩，放射性物質發(fā)生泄漏。R本人自食惡果不足惜影斑，卻給世界環(huán)境...
茶點故事閱讀 41,036評論 3贊 326
男人毒藥：我在死后第九天來索命
文/蒙蒙一给赞、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧矫户，春花似錦片迅、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,676評論 0贊 22
一樁弒父案柑蛇，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至驱闷，卻和暖如春耻台，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背空另。一陣腳步聲響...
開封第一講書人閱讀 32,829評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工盆耽，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人扼菠。一個月前我還...
沈念sama閱讀 47,743評論 2贊 368
代替公主和親
正文我出身青樓摄杂，卻偏偏與公主長得像，于是被迫代替她去往敵國和親循榆。傳聞我的和親對象是個殘疾皇子析恢，可洞房花燭夜當晚...
茶點故事閱讀 44,629評論 2贊 354

推薦系統(tǒng)遇上深度學習(七十)-[阿里]推薦中的個性化重排序