Spotify的交互式推薦系統(tǒng)

今天看了一個Recsys2015講交互式RS的slide被去,感覺我們可以借鑒梯皿。所以又看了兩篇Spotify RS的文章仇箱,與slide的內(nèi)容一起整理如下。

一索烹、產(chǎn)品形態(tài)

  1. 首先用戶通過一位藝術家端礼、專輯没佑、歌曲伞矩、播放列表或是風格流派開啟一個radio瓢阴。

  2. 接著用戶通過thumbs表達自己對歌曲的偏好,同時也是在tune推薦系統(tǒng)垒拢。推薦系統(tǒng)會根據(jù)thumbs的正負反饋旬迹,實時調(diào)整推薦結果。

二求类、整體數(shù)據(jù)流

Step1:訓練各種推薦模型

歌曲和電影的區(qū)別:

  • 數(shù)量級:電影6w奔垦;歌曲2000w。
  • 歌曲可以被同一用戶重復消費尸疆。
  • song is more niche.

Implicit Matrix Factorization

  • 把所有(user, track)數(shù)據(jù)組成一個矩陣椿猎。
  • 目標:最小化兩個小矩陣內(nèi)積與binary偏好矩陣的帶權RMSE。權重由一個包含了播放行為寿弱、上下文和新穎度的函數(shù)給出犯眠。

其中如果用戶u對歌曲i有行為則p_ui=1,否則p_ui=0症革。
c_ui=1+alpha * r_ui

或者

  • 目標:假設用戶播放一個歌曲的概率是logistic筐咧,然后最大化偏好矩陣的log likelihood。其中同樣要對正反饋加權噪矛。

通常用ALS來求解量蕊。得到兩個小矩陣a、b后艇挨,用戶u對歌曲i的偏好就是:



歌曲i與歌曲j的相似度為:


Spotiy開源了找近似最近鄰的工具:https://github.com/spotify/annoy

NLP models on News, Blogs, and Text

Distributed Representations of Words and Phrases and their Compositionality: http://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf

Deep Learning on Audio

協(xié)同過濾模型會把用戶和歌曲分別映射到低維的隱空間里残炮。歌曲在隱空間中的位置,相當于反應收聽偏好的各種信息的編碼缩滨。如果兩個歌曲在隱空間中距離較近吉殃,說明它們可能比較相似辞居。如果一個歌曲與用戶的距離較近,它可能就是這個用戶的一個好的推薦結果蛋勺。如果我們能預測一個歌曲在隱空間中的位置,就可以把他推薦給合適的用戶鸠删,并且不需要它的歷史行為數(shù)據(jù)抱完。

這里是用了CNN把音頻信號回歸到CF的隱向量。和做圖片預測有很多不一樣的地方刃泡,具體見這個博客:http://benanne.github.io/2014/08/05/spotify-cnns.html

Step2:用thumbs數(shù)據(jù)組合多種模型

Step3:自適應個性化

給定用戶u巧娱, Station S,在t時刻選擇歌曲i的概率:


其中烘贴,
rank(i, S)是歌曲庫中的全局排序禁添,
rel(u, i)是根據(jù)CF向量得到的用戶商品相關性
thumb(u, i)是根據(jù)thumb得到的用戶商品相關性
div(u, i, t)表示session中藝術家與專輯的多樣性

Step4:把thumbs反饋引入組合模型

三、見解

用戶角度

  • 交互式RS在產(chǎn)品中的布局很重要
    • 要把瀏覽和搜索行為自然的過渡到交互行為
  • 交互式RS要盡可能做到輕量級
    • 用戶偏愛lean-back的體驗
    • 交互意味著要盡快幫用戶找到最優(yōu)item
    • 推薦解釋可以建立信任和透明性
  • 選擇
    • 多少輸入合適
    • 多少返回結果合適

算法角度

  • 在交互系統(tǒng)的不同階段需要平衡流行性桨踪,相關性多樣性老翘。
  • 實時打分 vs 離線推薦結果計算

引用

InteractiveRecommender Systems, Recsys2015

Hu Y. & Koren Y. & Volinsky C. (2008) Collaborative Filtering for Implicit Feedback Datasets 8th IEEE International Conference on Data Mining

Johnson C. (2014) Logistic Matrix Factorization for Implicit Feedback Data NIPS Workshop on Distributed Matrix Computations

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市锻离,隨后出現(xiàn)的幾起案子铺峭,更是在濱河造成了極大的恐慌,老刑警劉巖汽纠,帶你破解...
    沈念sama閱讀 212,718評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件卫键,死亡現(xiàn)場離奇詭異,居然都是意外死亡虱朵,警方通過查閱死者的電腦和手機莉炉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,683評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來碴犬,“玉大人絮宁,你說我怎么就攤上這事〕岬校” “怎么了羞福?”我有些...
    開封第一講書人閱讀 158,207評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長蚯涮。 經(jīng)常有香客問我治专,道長,這世上最難降的妖魔是什么遭顶? 我笑而不...
    開封第一講書人閱讀 56,755評論 1 284
  • 正文 為了忘掉前任张峰,我火速辦了婚禮,結果婚禮上棒旗,老公的妹妹穿的比我還像新娘喘批。我一直安慰自己撩荣,他們只是感情好,可當我...
    茶點故事閱讀 65,862評論 6 386
  • 文/花漫 我一把揭開白布饶深。 她就那樣靜靜地躺著餐曹,像睡著了一般。 火紅的嫁衣襯著肌膚如雪敌厘。 梳的紋絲不亂的頭發(fā)上台猴,一...
    開封第一講書人閱讀 50,050評論 1 291
  • 那天,我揣著相機與錄音俱两,去河邊找鬼饱狂。 笑死,一個胖子當著我的面吹牛宪彩,可吹牛的內(nèi)容都是我干的休讳。 我是一名探鬼主播,決...
    沈念sama閱讀 39,136評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼尿孔,長吁一口氣:“原來是場噩夢啊……” “哼俊柔!你這毒婦竟也來了?” 一聲冷哼從身側響起纳猫,我...
    開封第一講書人閱讀 37,882評論 0 268
  • 序言:老撾萬榮一對情侶失蹤婆咸,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后芜辕,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體尚骄,經(jīng)...
    沈念sama閱讀 44,330評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,651評論 2 327
  • 正文 我和宋清朗相戀三年侵续,在試婚紗的時候發(fā)現(xiàn)自己被綠了倔丈。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,789評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡状蜗,死狀恐怖需五,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情轧坎,我是刑警寧澤宏邮,帶...
    沈念sama閱讀 34,477評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站缸血,受9級特大地震影響蜜氨,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜捎泻,卻給世界環(huán)境...
    茶點故事閱讀 40,135評論 3 317
  • 文/蒙蒙 一飒炎、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧笆豁,春花似錦郎汪、人聲如沸赤赊。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,864評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽抛计。三九已至,卻和暖如春耕驰,著一層夾襖步出監(jiān)牢的瞬間爷辱,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,099評論 1 267
  • 我被黑心中介騙來泰國打工朦肘, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人双饥。 一個月前我還...
    沈念sama閱讀 46,598評論 2 362
  • 正文 我出身青樓媒抠,卻偏偏與公主長得像,于是被迫代替她去往敵國和親咏花。 傳聞我的和親對象是個殘疾皇子趴生,可洞房花燭夜當晚...
    茶點故事閱讀 43,697評論 2 351

推薦閱讀更多精彩內(nèi)容