《Collaborative Filtering with Recurrent Neural Networks》簡(jiǎn)介

一锐秦、標(biāo)題

Collaborative Filtering with Recurrent Neural Networks

二备燃、來(lái)源

arXiv.org

三讹躯、問(wèn)題

作者通過(guò)分析囱挑,認(rèn)為傳統(tǒng)推薦常用的協(xié)同過(guò)濾方法可以看作時(shí)間序列的預(yù)測(cè)問(wèn)題醉顽。進(jìn)而引入RNN這一處理序列問(wèn)題常用的深度網(wǎng)絡(luò)學(xué)習(xí)模型。

四平挑、主要方法

4.1 RNNs(LSTM)

將數(shù)據(jù)集中出現(xiàn)的每個(gè)item視作一個(gè)詞游添,item的集合視作詞的集合。借用bag-of-words的思想弹惦,將每個(gè)item用one-hot向量表示否淤。同時(shí)將每個(gè)用戶(hù)的歷史行為作為采樣的時(shí)間序列。每一時(shí)刻棠隐, RNN模型的輸入即為對(duì)應(yīng)時(shí)刻item的one-hot編碼表示石抡,輸出則為每個(gè)item對(duì)應(yīng)神經(jīng)元的softmax值的大小(所有用戶(hù)行為中出現(xiàn)的item均有對(duì)應(yīng)的softmax的輸出)助泽福可以根據(jù)問(wèn)題需要返回softmax最大的前k個(gè)值作為推薦的item.
??這里,為了避免梯度消失的問(wèn)題嗡贺,文中采用"gated?RNN"即LSTM.目標(biāo)損失函數(shù)為item類(lèi)別的交叉熵函數(shù)隐解。一般形式為

??這里的ocorrect表示與實(shí)際時(shí)間序列輸出item相對(duì)應(yīng)的模型神經(jīng)元的取值,如果該神經(jīng)元的softmax符合前述要求(在最大的前k個(gè)值中)诫睬,則將ocorrect記為1煞茫,否則則記為0.

4.2 Markov Chain

Markov?Chain是時(shí)序預(yù)測(cè)中比較常見(jiàn)的方法。本文中,作者利用Markov?Chain续徽,將用戶(hù)的行為中的item視為不同的state.不同state的轉(zhuǎn)移概率表示用戶(hù)從一個(gè)item轉(zhuǎn)向下一個(gè)item的可能性的大小蚓曼。推薦時(shí)返回轉(zhuǎn)移概率最大的前k個(gè)item.

4.3 KNN(Userbased-CF)

基于user屬性的協(xié)同過(guò)濾是傳統(tǒng)的推薦方法之一∏张ぃ基于以下打分函數(shù)纫版,給出top-N的結(jié)果。

??上式中ciu表示用戶(hù)i與用戶(hù)u的相似程度客情,文中相似程度是用余弦距離度量的其弊。后面的示性函數(shù)表示該物品是否在用戶(hù)u的歷史行為中出現(xiàn)過(guò)。

4.4 BPR-MF

該方法是目前推薦領(lǐng)域先進(jìn)的矩陣分解方法膀斋,在Mymedialite上有開(kāi)發(fā)成熟的工具包梭伐。

五、相關(guān)工作

  • 提出將協(xié)同過(guò)濾視為序列預(yù)測(cè)問(wèn)題的思想概页。
    ??作者提出籽御,傳統(tǒng)基于協(xié)同過(guò)濾的推薦方法,無(wú)論基于何種特征惰匙,都沒(méi)有考慮用戶(hù)歷史行為的時(shí)間屬性,只是將歷史行為中的每個(gè)item統(tǒng)一考慮铃将。這樣處理帶來(lái)的最大問(wèn)題在于推薦系統(tǒng)無(wú)法分析用戶(hù)喜好的變化情況项鬼,從而給出更符合用戶(hù)現(xiàn)階段喜好的推薦結(jié)果。那么劲阎,如果基于協(xié)同過(guò)濾“由過(guò)去绘盟,看未來(lái)”的思想,如果將該問(wèn)題視作序列預(yù)測(cè)問(wèn)題悯仙,一方面可以更好的分析用戶(hù)的興趣愛(ài)好的變化情況給出更好的推薦結(jié)果龄毡,另一方面也可以將在時(shí)序預(yù)測(cè)問(wèn)題中廣泛使用的RNN深度網(wǎng)絡(luò)模型引入到推薦系統(tǒng)中。
  • 分析其他特征對(duì)推薦結(jié)果的影響
    ??前述RNN模型在輸入時(shí)锡垄,只將item的one-hot屬性作為輸入信息沦零。作者這里考慮將其他特征輸入模型,比如用戶(hù)的信息货岭,item的屬性路操,用戶(hù)與item交互的信息等。作者這里將這些屬性也用one-hot編碼的形式表示千贯,與之前的item向量拼接作為新的輸入屯仗。下表是相關(guān)結(jié)果:



    ??從圖中可以看出,引入新的特征對(duì)模型的提升作用并不明顯搔谴,由此作者認(rèn)為魁袜,時(shí)間序列已經(jīng)包含大部分這里加入的信息,我們可以通過(guò)對(duì)時(shí)間序列的分析來(lái)隱含的利用信息。

六峰弹、簡(jiǎn)評(píng)

之所以選擇這篇論文店量,一個(gè)重要原因在于自己考慮將RNN用在時(shí)間序列預(yù)測(cè)問(wèn)題上,本篇論文提出的思路對(duì)自己是一個(gè)很好的啟發(fā)垮卓。本篇論文的可貴之處不僅在于提出了看待協(xié)同過(guò)濾問(wèn)題的新的角度垫桂,更在于他對(duì)模型參數(shù)進(jìn)行了詳細(xì)的分析,有利于具體的工程實(shí)踐粟按。但本文也存在一些瑕疵诬滩,比如就數(shù)據(jù)集本身而言,并不具備時(shí)序的信息灭将,而且數(shù)據(jù)量是否可以減弱過(guò)擬合的影響疼鸟,這些問(wèn)題顯得作者的結(jié)論說(shuō)服力有待加強(qiáng)。再者處理RNN的輸入時(shí)庙曙,作者只提到將item做one-hot編碼空镜,但不同時(shí)間序列可能屬于不同用戶(hù),這一點(diǎn)對(duì)于RNN模型的訓(xùn)練影響捌朴,作者在訓(xùn)練時(shí)是否考慮這一因素文中也沒(méi)有提及吴攒。總的說(shuō)來(lái)砂蔽,本篇論文提出的思想難能可貴洼怔,但具體到工程應(yīng)用,還需要更多工作要做左驾。
??以上都是本人自己的觀(guān)點(diǎn)看法镣隶,肯定存在疏漏錯(cuò)誤的地方,歡迎交流討論诡右。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末安岂,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子帆吻,更是在濱河造成了極大的恐慌域那,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,542評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件桅锄,死亡現(xiàn)場(chǎng)離奇詭異琉雳,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)友瘤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,596評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén)翠肘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人辫秧,你說(shuō)我怎么就攤上這事束倍。” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 158,021評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵绪妹,是天一觀(guān)的道長(zhǎng)甥桂。 經(jīng)常有香客問(wèn)我,道長(zhǎng)邮旷,這世上最難降的妖魔是什么黄选? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,682評(píng)論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮婶肩,結(jié)果婚禮上办陷,老公的妹妹穿的比我還像新娘。我一直安慰自己律歼,他們只是感情好民镜,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,792評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著险毁,像睡著了一般制圈。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上畔况,一...
    開(kāi)封第一講書(shū)人閱讀 49,985評(píng)論 1 291
  • 那天鲸鹦,我揣著相機(jī)與錄音,去河邊找鬼跷跪。 笑死亥鬓,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的域庇。 我是一名探鬼主播,決...
    沈念sama閱讀 39,107評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼覆积,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼听皿!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起宽档,我...
    開(kāi)封第一講書(shū)人閱讀 37,845評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤尉姨,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后吗冤,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體又厉,經(jīng)...
    沈念sama閱讀 44,299評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,612評(píng)論 2 327
  • 正文 我和宋清朗相戀三年椎瘟,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了覆致。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,747評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡肺蔚,死狀恐怖煌妈,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤璧诵,帶...
    沈念sama閱讀 34,441評(píng)論 4 333
  • 正文 年R本政府宣布汰蜘,位于F島的核電站,受9級(jí)特大地震影響之宿,放射性物質(zhì)發(fā)生泄漏族操。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,072評(píng)論 3 317
  • 文/蒙蒙 一比被、第九天 我趴在偏房一處隱蔽的房頂上張望色难。 院中可真熱鬧,春花似錦姐赡、人聲如沸莱预。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,828評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)依沮。三九已至,卻和暖如春枪狂,著一層夾襖步出監(jiān)牢的瞬間危喉,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,069評(píng)論 1 267
  • 我被黑心中介騙來(lái)泰國(guó)打工州疾, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留辜限,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,545評(píng)論 2 362
  • 正文 我出身青樓严蓖,卻偏偏與公主長(zhǎng)得像薄嫡,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子颗胡,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,658評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容