協(xié)同過濾(Collaborative Filtering)作為推薦算法中最經(jīng)典的類型,包括在線的協(xié)同和離線的過濾兩部分掌动。所謂在線協(xié)同,就是通過在線數(shù)據(jù)找到用戶可能喜歡的物品,而離線過濾宝泵,則是過濾掉一些不值得推薦的數(shù)據(jù),比比如推薦值評(píng)分低的數(shù)據(jù)轩娶,或者雖然推薦值高但是用戶已經(jīng)購(gòu)買的數(shù)據(jù)儿奶。
協(xié)同過濾的模型一般為m個(gè)物品,m個(gè)用戶的數(shù)據(jù)鳄抒,只有部分用戶和部分?jǐn)?shù)據(jù)之間是有評(píng)分?jǐn)?shù)據(jù)的闯捎,其它部分評(píng)分是空白椰弊,此時(shí)我們要用已有的部分稀疏數(shù)據(jù)來預(yù)測(cè)那些空白的物品和數(shù)據(jù)之間的評(píng)分關(guān)系,找到最高評(píng)分的物品推薦給用戶瓤鼻。
一般來說秉版,協(xié)同過濾推薦分為三種類型。第一種是基于用戶(user-based)的協(xié)同過濾娱仔,第二種是基于項(xiàng)目(item-based)的協(xié)同過濾沐飘,第三種是基于模型(model based)的協(xié)同過濾。
本系統(tǒng)采用的是基于項(xiàng)目(item-based)的協(xié)同過濾牲迫,這主要考慮的是物品與物品之間的相似度耐朴,只有找到了目標(biāo)用戶對(duì)某些物品的評(píng)分,那么我們就可以對(duì)相似度高的類似物品進(jìn)行預(yù)測(cè)盹憎,將評(píng)分最高的若干個(gè)相似物品推薦給用戶筛峭。比如你在網(wǎng)上買了一本機(jī)器學(xué)習(xí)相關(guān)的書,網(wǎng)站馬上會(huì)推薦一堆機(jī)器學(xué)習(xí)陪每,大數(shù)據(jù)相關(guān)的書給你影晓,這里就明顯用到了基于項(xiàng)目的協(xié)同過濾思想。
基于項(xiàng)目的協(xié)同過濾檩禾,由于考慮的物品的相似性一段時(shí)間不會(huì)改變挂签,因此可以很容易的離線計(jì)算,準(zhǔn)確度也可以接受盼产,對(duì)于本圖書推薦系統(tǒng)來說饵婆,基于項(xiàng)目的協(xié)同過濾肯定是主流。