個性化推薦系列之協(xié)同過濾推薦算法總結(jié)

前面我們詳細(xì)了解了一下目前比較成熟的集中推薦算法模型济炎,包括基于內(nèi)容的推薦算法、基于規(guī)則的推薦算法以及協(xié)同過濾推薦算法辐真,也詳細(xì)分析了一下每一種推薦算法的優(yōu)勢與劣勢须尚;

我們分析到,基于內(nèi)容的推薦算法與基于規(guī)則的推薦算法侍咱,由于其兩者的優(yōu)劣性耐床,同時也由于協(xié)同過濾的優(yōu)勢,更多的推薦場景會選擇協(xié)同過濾算法楔脯;那么協(xié)同過濾推薦算法到底是什么樣推薦工作的撩轰;;

我們前面分析到昧廷,協(xié)同過濾推薦算法的原理是基于用戶歷史行為作為分析對象堪嫂, 用戶喜歡消費(fèi)那些具有相似行為的用戶消費(fèi)/喜歡過的信息, 基于其它和當(dāng)前用戶相似的用戶的行為木柬,推薦信息給當(dāng)前用戶皆串;

協(xié)同過濾推薦模型包含三種協(xié)同類型:1)、基于用戶的協(xié)同過濾眉枕;2)恶复、基于項目(內(nèi)容)的協(xié)同過濾;3)速挑、基于模型的協(xié)同過濾寂玲;

-----------------------------------------------------------------------------------------------------------------------------------------------

下面我們詳細(xì)介紹這三種類型的推薦算法是怎么實現(xiàn)推薦的,推薦原理是怎么樣的梗摇;

1)、基于用戶的協(xié)同過濾想许;

基于用戶的協(xié)同過濾是利用數(shù)據(jù)統(tǒng)計找到與目標(biāo)用戶有著相同喜好的相似用戶伶授,根據(jù)目標(biāo)用戶的相似用戶的喜好產(chǎn)生向目標(biāo)用戶的推薦內(nèi)容;到底是怎么實現(xiàn)的流纹;

我們來做一個假設(shè):

用戶1(運(yùn)營)喜歡書籍A糜烹、書籍C;

用戶2(測試)喜歡書籍B漱凝;

用戶3(產(chǎn)品)喜歡書籍A疮蹦、書籍C、書籍D茸炒;

通過數(shù)據(jù)(用戶之間多維空間中兩個向量夾角的余弦公式)我們發(fā)現(xiàn)用戶1(運(yùn)營)和用戶3(產(chǎn)品)喜好比較相似愕乎,同時我們發(fā)現(xiàn)用戶3喜歡書籍D阵苇,我們預(yù)測用戶1也會喜歡書籍D,那么這個時候我們就可以把書籍D推薦給用戶1感论;這就是基于用戶的協(xié)同過濾推薦绅项;

-----------------------------------------------------------------------------------------------------------------------------------------------

2)、基于項目(內(nèi)容)的協(xié)同過濾比肄;

基于內(nèi)容的協(xié)同過濾是利用數(shù)據(jù)統(tǒng)計找到歷史用戶對歷史消費(fèi)信息的評價數(shù)據(jù)值快耿,發(fā)掘信息與信息之間的相似度,根據(jù)目標(biāo)用戶的歷史消費(fèi)行為喜好將相似的信息推薦給目標(biāo)用戶芳绩;到底是怎么實現(xiàn)的掀亥;

我們來做一個假設(shè):

用戶1喜歡電影A(戰(zhàn)爭片)、電影C(戰(zhàn)爭片)妥色;

用戶2喜歡電影A(戰(zhàn)爭片)搪花、電影B(愛情片)、電影C(戰(zhàn)爭片)垛膝;

用戶3喜歡電影A(戰(zhàn)爭片)鳍侣;

通過數(shù)據(jù)(內(nèi)容之間多維空間中兩個向量夾角的余弦公式)我們發(fā)現(xiàn)電影A和電影C有著相似的信息屬性,同為戰(zhàn)爭片吼拥,喜歡電影A的用戶都喜歡電影C倚聚,基于這兩者之間的數(shù)據(jù)關(guān)聯(lián)關(guān)系,我們發(fā)現(xiàn)用戶3喜歡電影A,所以我們預(yù)測用戶3也會喜歡電影C凿可,那么這個時候我們就可以把電影C推薦給用戶3惑折;這就是基于內(nèi)容的協(xié)同過濾;

-----------------------------------------------------------------------------------------------------------------------------------------------

3)枯跑、基于模型的協(xié)同過濾惨驶;

基于模型的協(xié)同過濾是目前最主流的協(xié)同過濾類型,該種推薦類型的模型是我們有m個物品敛助、m個用戶的數(shù)據(jù)粗卜,只有部分用戶和部分?jǐn)?shù)據(jù)之間是有評分?jǐn)?shù)據(jù)的,其它部分評分是空白纳击;此時我們要用已有的部分稀疏數(shù)據(jù)來預(yù)測那些空白的物品和數(shù)據(jù)之間的評分關(guān)系续扔,找到最高評分的物品推薦給目標(biāo)用戶;

基于模型的協(xié)同過濾推薦是基于樣本數(shù)據(jù)用戶喜好信息焕数,訓(xùn)練并建立一個推薦模型纱昧,然后根據(jù)實時的目標(biāo)用戶喜好信息進(jìn)行預(yù)測推薦;這個類型的推薦算法就利用到了機(jī)器學(xué)習(xí)模塊堡赔;這里不做過多介紹识脆;

-----------------------------------------------------------------------------------------------------------------------------------------------

通過對上述三種協(xié)同過濾類型的分析,我們簡單總結(jié)一下這幾種推薦類型的原理;

1)灼捂、基于用戶的協(xié)同過濾主要考慮的是用戶和用戶之間的相似度离例,找出相似用戶喜歡的物品,并預(yù)測目標(biāo)用戶對應(yīng)物品的評分纵东,就可以把評分最高的若干個物品推薦給目標(biāo)用戶粘招;比如某用戶(運(yùn)營類型)在網(wǎng)站買了一些運(yùn)營的書籍,另一個用戶(有著運(yùn)營標(biāo)簽)來網(wǎng)站偎球,網(wǎng)站就會推薦大量運(yùn)營的書籍給他洒扎;

2)、基于項目(內(nèi)容)的協(xié)同過濾主要考慮的是物品和物品之間的相似度衰絮,找到目標(biāo)用戶對某些物品的評分袍冷,就可以對相似度高的類似物品進(jìn)行預(yù)測,將評分最高的若干個相似物品推薦給目標(biāo)用戶猫牡;比如某用戶在網(wǎng)上買了一些大數(shù)據(jù)方面的書籍胡诗,網(wǎng)站就會推薦大量大數(shù)據(jù)、云計算淌友、機(jī)器學(xué)習(xí)的書籍給他煌恢;

3)、基于項目的協(xié)同過濾是基于樣本數(shù)據(jù)用戶喜好信息震庭,訓(xùn)練并建立一個推薦模型瑰抵,然后根據(jù)實時的目標(biāo)用戶喜好信息進(jìn)行預(yù)測推薦;這個類型的推薦算法利用到了機(jī)器學(xué)習(xí)模塊器联,這里不做過多介紹二汛;

-----------------------------------------------------------------------------------------------------------------------------------------------

我們對基于用戶的協(xié)同過濾和基于內(nèi)容的協(xié)同過濾做一個簡單的對比,了解一下兩者的優(yōu)勢與劣勢拨拓;(由于基于模型的協(xié)同過濾涉及到機(jī)器學(xué)習(xí)建模肴颊,這里不做介紹)

1)、基于用戶的協(xié)同過濾:劣勢是需要在線實時發(fā)掘用戶和用戶之間的相似度關(guān)系渣磷,計算復(fù)雜度非常高婿着;優(yōu)勢是可以幫助用戶找到新類別喜好的物品;

2)醋界、基于項目(內(nèi)容)的協(xié)同過濾:優(yōu)勢是物品之間的相似度長時間不會有大改變祟身,因此對計算的實時要求不高完全可以線下計算,由于計算量完全所以推薦準(zhǔn)確度非常高物独;劣勢是由于都是基相似內(nèi)容之間的關(guān)聯(lián)性做推薦,所以很難給用戶推薦新的興趣點的內(nèi)容氯葬;

-----------------------------------------------------------------------------------------------------------------------------------------------

這是個性化推薦系統(tǒng)系列的第4篇挡篓,該系列一共有5篇:1、《個性化推薦系列之初步認(rèn)識推薦系統(tǒng)》;2官研、《個性化推薦系列之初步認(rèn)識機(jī)器學(xué)習(xí)》秽澳;3、《個性化推薦系列之推薦系統(tǒng)的演化及常見推薦算法》戏羽;4担神、《個性化推薦系列之協(xié)同過濾推薦算法總結(jié)》;5始花、《個性化推薦系列之推薦算法實踐》妄讯;

詳見知乎專欄--產(chǎn)品打雜https://zhuanlan.zhihu.com/zhoulink

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市酷宵,隨后出現(xiàn)的幾起案子亥贸,更是在濱河造成了極大的恐慌,老刑警劉巖浇垦,帶你破解...
    沈念sama閱讀 223,207評論 6 521
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件炕置,死亡現(xiàn)場離奇詭異,居然都是意外死亡男韧,警方通過查閱死者的電腦和手機(jī)朴摊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,455評論 3 400
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來此虑,“玉大人甚纲,你說我怎么就攤上這事」炎常” “怎么了贩疙?”我有些...
    開封第一講書人閱讀 170,031評論 0 366
  • 文/不壞的土叔 我叫張陵,是天一觀的道長况既。 經(jīng)常有香客問我这溅,道長,這世上最難降的妖魔是什么棒仍? 我笑而不...
    開封第一講書人閱讀 60,334評論 1 300
  • 正文 為了忘掉前任悲靴,我火速辦了婚禮,結(jié)果婚禮上莫其,老公的妹妹穿的比我還像新娘癞尚。我一直安慰自己,他們只是感情好乱陡,可當(dāng)我...
    茶點故事閱讀 69,322評論 6 398
  • 文/花漫 我一把揭開白布浇揩。 她就那樣靜靜地躺著,像睡著了一般憨颠。 火紅的嫁衣襯著肌膚如雪胳徽。 梳的紋絲不亂的頭發(fā)上积锅,一...
    開封第一講書人閱讀 52,895評論 1 314
  • 那天,我揣著相機(jī)與錄音养盗,去河邊找鬼缚陷。 笑死,一個胖子當(dāng)著我的面吹牛往核,可吹牛的內(nèi)容都是我干的箫爷。 我是一名探鬼主播,決...
    沈念sama閱讀 41,300評論 3 424
  • 文/蒼蘭香墨 我猛地睜開眼聂儒,長吁一口氣:“原來是場噩夢啊……” “哼虎锚!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起薄货,我...
    開封第一講書人閱讀 40,264評論 0 277
  • 序言:老撾萬榮一對情侶失蹤翁都,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后谅猾,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體柄慰,經(jīng)...
    沈念sama閱讀 46,784評論 1 321
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,870評論 3 343
  • 正文 我和宋清朗相戀三年税娜,在試婚紗的時候發(fā)現(xiàn)自己被綠了坐搔。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,989評論 1 354
  • 序言:一個原本活蹦亂跳的男人離奇死亡敬矩,死狀恐怖概行,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情弧岳,我是刑警寧澤凳忙,帶...
    沈念sama閱讀 36,649評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站禽炬,受9級特大地震影響涧卵,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜腹尖,卻給世界環(huán)境...
    茶點故事閱讀 42,331評論 3 336
  • 文/蒙蒙 一柳恐、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧热幔,春花似錦乐设、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,814評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至场勤,卻和暖如春肿男,著一層夾襖步出監(jiān)牢的瞬間介汹,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,940評論 1 275
  • 我被黑心中介騙來泰國打工舶沛, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人窗价。 一個月前我還...
    沈念sama閱讀 49,452評論 3 379
  • 正文 我出身青樓如庭,卻偏偏與公主長得像,于是被迫代替她去往敵國和親撼港。 傳聞我的和親對象是個殘疾皇子坪它,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,995評論 2 361

推薦閱讀更多精彩內(nèi)容