《現(xiàn)代推薦算法》矩陣分解系列簡介

/關注公眾號 長歌大腿,發(fā)送“機器學習”關鍵字春哨,可獲取包含機器學習(包含深度學習),統(tǒng)計概率椰拒,優(yōu)化算法等系列文本與視頻經(jīng)典資料,如《ESL》《PRML》《MLAPP》等燃观。/
文章來源《現(xiàn)代推薦算法》矩陣分解系列簡介 .

該章主要介紹矩陣分解系列算法,該系列算法是推薦系統(tǒng)中最重要的算法之一憨颠,矩陣分解原理清晰积锅,且復雜度不那么高。

對于矩陣分解系列算法在推薦算法中而言缚陷,其容易編程實現(xiàn),實現(xiàn)復雜度低嚷节,預測效果也好虎锚,同時還能保持擴展性。這些都是它寶貴的優(yōu)點效斑。當然柱徙,矩陣分解方法有時候解釋性還是沒有基于概率的邏輯回歸之類的推薦算法好,不過這也不影響它的流行程度护侮。對于較為小型的推薦系統(tǒng)來說用矩陣分解應該是一個不錯的選擇。大型的話滨溉,則矩陣分解比起現(xiàn)在的流行的深度學習推薦算法的一些方法不占優(yōu)勢凳忙。

矩陣分解推薦算法簡介

2009年舉辦了一個Netflix Prize比賽禽炬,發(fā)出的是一個評分預測的問題。就是每個用戶給電影打了1-5分腹尖,然后讓你去預測一個用戶對一個電影會打多少分伐脖。這種只有“用戶”+“評分”的兩元素構型的打分矩陣乐设,也稱為“user-item矩陣”。在整個“user-item矩陣”中蠕啄,因為實際情況及個人愛好等原因戈锻,其實大部分是“空狀態(tài)”,“空狀態(tài)”表示了“沒有任何了解”格遭,而沒有“非空狀態(tài)”的肯定是表示了人對電影打過分,而且分數(shù)范圍1-5分的分數(shù)骚秦。所以璧微,比賽其實規(guī)則很簡單,整個比賽的目的就是去用“非空狀態(tài)”與預測那些“空狀態(tài)”蒙揣,具體會被打多少分开瞭。

這個時候,這種“user-item矩陣”就是一種“向量/矩陣”形式的結(jié)構化數(shù)據(jù)了嗤详,以數(shù)據(jù)表形式存儲和表達。那么一個嚴重的問題就出現(xiàn)了递宅,針對于這種“結(jié)構化數(shù)據(jù)”苍狰,但是結(jié)構又非常簡單,只有兩個維度的特征淋昭,如何能夠做推薦系統(tǒng)就成了關鍵,而且這種推薦要求原理簡單而且使用效果好英融,包括數(shù)學理論知識扎實和計算復雜度的可接受性。

在Netflix Prize之前胡野,類似問題很多方案都是把缺失的值都填上3分痕鳍,類似于結(jié)構化數(shù)據(jù)特征預處理的缺失數(shù)據(jù)處理一樣:離散數(shù)據(jù)用眾數(shù)填充,連續(xù)數(shù)據(jù)用中位數(shù)填充笼呆,然后把user-item矩陣做SVD分解,選取最大的K個特征值對應的特征向量組成的矩陣耘眨,然后再乘起來境肾。這個時候,那些確實的數(shù)據(jù)對都變成了其他的分數(shù)奥喻,這個分數(shù)就是預估值。但是這樣可行的原因是數(shù)據(jù)集量不是那么大纯趋,但是當數(shù)據(jù)集到了幾十萬維的矩陣冷离,這個時候SVD是不可行的,因為SVD分解是個O(n^3)的復雜度的算法痹栖。

SVD適用于稠密矩陣瞭空,計算復雜度高,只能適用于小型的低階推薦系統(tǒng)咆畏。

FunkSVD 優(yōu)化策略中使用了L2正則化,可以適用于稀疏矩陣溺健,計算復雜度低钦讳,有防止過擬合得考慮。在FunkSVD上愿卒,加入了各項的偏置考慮琼开,引出了BiasSVD。再引入用戶反饋考慮柜候,修改模型得到了SVD++算法。再加入時間權重衰減問題的考慮鹦肿,得到了TimesSVD++的算法辅柴。

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市涣旨,隨后出現(xiàn)的幾起案子股冗,更是在濱河造成了極大的恐慌,老刑警劉巖止状,帶你破解...
    沈念sama閱讀 216,402評論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件怯疤,死亡現(xiàn)場離奇詭異,居然都是意外死亡辅髓,警方通過查閱死者的電腦和手機少梁,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來第焰,“玉大人妨马,你說我怎么就攤上這事杀赢∠孀荩” “怎么了?”我有些...
    開封第一講書人閱讀 162,483評論 0 353
  • 文/不壞的土叔 我叫張陵砌左,是天一觀的道長铺敌。 經(jīng)常有香客問我,道長偿凭,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,165評論 1 292
  • 正文 為了忘掉前任取视,我火速辦了婚禮作谭,結(jié)果婚禮上奄毡,老公的妹妹穿的比我還像新娘。我一直安慰自己吼过,他們只是感情好,可當我...
    茶點故事閱讀 67,176評論 6 388
  • 文/花漫 我一把揭開白布酱床。 她就那樣靜靜地躺著趟佃,像睡著了一般。 火紅的嫁衣襯著肌膚如雪罐寨。 梳的紋絲不亂的頭發(fā)上序矩,一...
    開封第一講書人閱讀 51,146評論 1 297
  • 那天,我揣著相機與錄音瓶蝴,去河邊找鬼。 笑死舷手,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的狡恬。 我是一名探鬼主播蝎宇,決...
    沈念sama閱讀 40,032評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼祷安,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了凉唐?” 一聲冷哼從身側(cè)響起霍骄,我...
    開封第一講書人閱讀 38,896評論 0 274
  • 序言:老撾萬榮一對情侶失蹤读整,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后米间,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,311評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡的榛,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,536評論 2 332
  • 正文 我和宋清朗相戀三年夫晌,在試婚紗的時候發(fā)現(xiàn)自己被綠了昧诱。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,696評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡要糊,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出锄俄,到底是詐尸還是另有隱情,我是刑警寧澤奶赠,帶...
    沈念sama閱讀 35,413評論 5 343
  • 正文 年R本政府宣布毅戈,位于F島的核電站,受9級特大地震影響苇经,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜商模,卻給世界環(huán)境...
    茶點故事閱讀 41,008評論 3 325
  • 文/蒙蒙 一蜘澜、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧瞪醋,春花似錦装诡、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至咱旱,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間鲜侥,已是汗流浹背诸典。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留舀寓,地道東北人。 一個月前我還...
    沈念sama閱讀 47,698評論 2 368
  • 正文 我出身青樓必尼,卻偏偏與公主長得像篡撵,于是被迫代替她去往敵國和親判莉。 傳聞我的和親對象是個殘疾皇子育谬,可洞房花燭夜當晚...
    茶點故事閱讀 44,592評論 2 353

推薦閱讀更多精彩內(nèi)容