推薦系統(tǒng)遇上深度學(xué)習(xí)(四十一)-Improved Recurrent Neural Networks for Session-based Recommendations

本文論文的題目是《Improved Recurrent Neural Networks for Session-based Recommendations》
論文下載地址為:https://arxiv.org/abs/1606.08117

本文仍然使用RNN做基于會話的推薦迫像,但在此基礎(chǔ)上蠢熄,提出了幾種提升預(yù)測效果的方法粉捻,我們一起來學(xué)習(xí)一下吧娃承。

1、基礎(chǔ)模型

基本的RNN模型如下圖所示:

而對于其中一個序列迫悠,其過程如下:

對于一個輸入序列x= [x1,x2,....,xr-1,xr]忆家,模型輸出y=M(x),并使用交叉熵?fù)p失或者rank的損失函數(shù)(如上一篇中提到的BPR和TOP1損失函數(shù))來進(jìn)行模型的訓(xùn)練。

2雀监、模型改進(jìn)

本節(jié)介紹幾種針對基礎(chǔ)模型的改進(jìn)双吆。包括Data augmentationAdapting to temporal changes会前、Use of privileged information好乐、Output embeddings for faster predictions,咱們細(xì)細(xì)道來瓦宜。

2.1 Data augmentation

第一種方式是數(shù)據(jù)增強(qiáng)蔚万,本文提出了兩種增強(qiáng)的方式。

第一種方式临庇,便是將一條長度為n的序列拆分成n-1條訓(xùn)練數(shù)據(jù)反璃,假設(shè)一條長度為4的序列(l1,l2,l3,l4),將其拆分成3條數(shù)據(jù),即((l1),l2),((l1,l2),l3),((l1,l2,l3),l4)假夺。如下圖所示:

第二種方式淮蜈,是將點擊序列中的一些數(shù)據(jù)隨機(jī)的丟掉,可以增強(qiáng)訓(xùn)練的魯棒性已卷,如下圖所示:

2.2 Adapting to temporal changes

用戶的行為偏好是隨著時間而變化的梧田,近期的行為能夠更好的代表當(dāng)前用戶的偏好。因此啊,我們可以定義一個近期的時間節(jié)點裁眯,比如近半年之內(nèi)鹉梨,只用這部分?jǐn)?shù)據(jù)去訓(xùn)練模型。但是呢穿稳,這樣會造成訓(xùn)練數(shù)據(jù)太少存皂。

所以文中使用預(yù)訓(xùn)練的方法。即用所有的數(shù)據(jù)先預(yù)訓(xùn)練模型司草,然后只用近期的數(shù)據(jù)進(jìn)行模型的進(jìn)一步訓(xùn)練艰垂。

2.3 Use of privileged information

這里是使用privileged information(不知是否可以翻譯為超越信息)來訓(xùn)練模型。假設(shè)有序列[x1,x2,....,xr,xr+1,...,xn-1,xn]埋虹,當(dāng)此條訓(xùn)練數(shù)據(jù)是使用[x1,x2,....,xr]預(yù)測xr+1猜憎,那么其對應(yīng)的privileged information是[xn,xn-1,...,xr+2]。

思路是搔课,用戶點擊某item后的點擊序列中實際上能提供該item的信息胰柑,這些信息盡管在實際預(yù)測時使用不上,但在訓(xùn)練時我們可以加以利用爬泥。具體做法上柬讨,先使用privileged information訓(xùn)練一個模型,作為teacher模型袍啡,然后訓(xùn)練一個student模型踩官,即我們實際想要學(xué)習(xí)的模型。

假設(shè)teacher模型是M*境输,模型輸出是M*(x*)蔗牡,student模型是M,模型輸出為M(x)嗅剖,預(yù)測的實際輸出(即label對應(yīng)的one-hot encoding)為V(xn)辩越,那么此時的損失函數(shù)為:

2.4 Output embeddings for faster predictions

模型在最后輸出層的參數(shù)數(shù)目為H * N,H是GRU單元的size信粮,N是item的數(shù)量黔攒。當(dāng)我們的item數(shù)目過多的時候,這樣不僅訓(xùn)練慢强缘,同時在預(yù)測階段的時間也會比較長督惰。有兩種常見的方法,即我們在word2vec中見過的旅掂,hierarchical softmax和負(fù)采樣姑丑。

本文提出了一種新的做法,即輸出層預(yù)測的不再是點擊每個item的概率辞友,而是直接輸出item的embedding栅哀,并與label對應(yīng)的item的embedding進(jìn)行對比震肮,計算cosine距離作為損失。

但是留拾,這種方法需要item的embedding十分準(zhǔn)確戳晌,本文提出的方法是使用模型訓(xùn)練出的item embedding作為label。而這里的模型可以是使用基準(zhǔn)模型+前三種改進(jìn)方式訓(xùn)練出的模型痴柔。

3沦偎、實驗效果及結(jié)論

好了,論文實驗了上面幾種改進(jìn)方法的效果:

M1:基準(zhǔn)RNN模型 + 數(shù)據(jù)增強(qiáng)
M2:基準(zhǔn)RNN模型 + 數(shù)據(jù)增強(qiáng) + 預(yù)訓(xùn)練
M3:基準(zhǔn)RNN模型 + privileged information
M4:基準(zhǔn)RNN模型 + Output embeddings咳蔚,這里使用的item embedding是使用M1模型訓(xùn)練出的豪嚎。

模型結(jié)果如下:

左面的結(jié)果,GRU size是100谈火,右邊是GRU size是1000侈询。虛線是基準(zhǔn)模型的結(jié)果,橫軸的負(fù)數(shù)代表使用的訓(xùn)練集糯耍。比如扔字,我們將所有的訓(xùn)練集按照時間先后排序,-8即代表使用最近的1/256的數(shù)據(jù)集進(jìn)行訓(xùn)練温技,-6代表使用最近的1/64的數(shù)據(jù)集進(jìn)行訓(xùn)練革为,0就是使用所有的訓(xùn)練集進(jìn)行訓(xùn)練。

可以看到舵鳞,M2的效果最好震檩,同時,使用最近1/64的數(shù)據(jù)可以得到最好的效果蜓堕。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末抛虏,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子俩滥,更是在濱河造成了極大的恐慌,老刑警劉巖贺奠,帶你破解...
    沈念sama閱讀 218,525評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件霜旧,死亡現(xiàn)場離奇詭異,居然都是意外死亡儡率,警方通過查閱死者的電腦和手機(jī)挂据,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,203評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來儿普,“玉大人崎逃,你說我怎么就攤上這事∶己ⅲ” “怎么了个绍?”我有些...
    開封第一講書人閱讀 164,862評論 0 354
  • 文/不壞的土叔 我叫張陵勒葱,是天一觀的道長。 經(jīng)常有香客問我巴柿,道長凛虽,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,728評論 1 294
  • 正文 為了忘掉前任广恢,我火速辦了婚禮凯旋,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘钉迷。我一直安慰自己至非,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,743評論 6 392
  • 文/花漫 我一把揭開白布糠聪。 她就那樣靜靜地躺著荒椭,像睡著了一般。 火紅的嫁衣襯著肌膚如雪枷颊。 梳的紋絲不亂的頭發(fā)上戳杀,一...
    開封第一講書人閱讀 51,590評論 1 305
  • 那天,我揣著相機(jī)與錄音夭苗,去河邊找鬼信卡。 笑死,一個胖子當(dāng)著我的面吹牛题造,可吹牛的內(nèi)容都是我干的傍菇。 我是一名探鬼主播,決...
    沈念sama閱讀 40,330評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼界赔,長吁一口氣:“原來是場噩夢啊……” “哼丢习!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起淮悼,我...
    開封第一講書人閱讀 39,244評論 0 276
  • 序言:老撾萬榮一對情侶失蹤咐低,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后袜腥,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體见擦,經(jīng)...
    沈念sama閱讀 45,693評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,885評論 3 336
  • 正文 我和宋清朗相戀三年羹令,在試婚紗的時候發(fā)現(xiàn)自己被綠了鲤屡。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,001評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡福侈,死狀恐怖酒来,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情肪凛,我是刑警寧澤堰汉,帶...
    沈念sama閱讀 35,723評論 5 346
  • 正文 年R本政府宣布辽社,位于F島的核電站,受9級特大地震影響衡奥,放射性物質(zhì)發(fā)生泄漏爹袁。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,343評論 3 330
  • 文/蒙蒙 一矮固、第九天 我趴在偏房一處隱蔽的房頂上張望失息。 院中可真熱鬧,春花似錦档址、人聲如沸盹兢。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,919評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽绎秒。三九已至,卻和暖如春尼摹,著一層夾襖步出監(jiān)牢的瞬間见芹,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,042評論 1 270
  • 我被黑心中介騙來泰國打工蠢涝, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留玄呛,地道東北人。 一個月前我還...
    沈念sama閱讀 48,191評論 3 370
  • 正文 我出身青樓和二,卻偏偏與公主長得像徘铝,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子惯吕,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,955評論 2 355

推薦閱讀更多精彩內(nèi)容