前面我們詳細(xì)了解了一下目前比較成熟的集中推薦算法模型济炎,包括基于內(nèi)容的推薦算法、基于規(guī)則的推薦算法以及協(xié)同過濾推薦算法辐真,也詳細(xì)分析了一下每一種推薦算法的優(yōu)勢與劣勢须尚;
我們分析到,基于內(nèi)容的推薦算法與基于規(guī)則的推薦算法侍咱,由于其兩者的優(yōu)劣性耐床,同時也由于協(xié)同過濾的優(yōu)勢,更多的推薦場景會選擇協(xié)同過濾算法楔脯;那么協(xié)同過濾推薦算法到底是什么樣推薦工作的撩轰;;
我們前面分析到昧廷,協(xié)同過濾推薦算法的原理是基于用戶歷史行為作為分析對象堪嫂, 用戶喜歡消費(fèi)那些具有相似行為的用戶消費(fèi)/喜歡過的信息, 基于其它和當(dāng)前用戶相似的用戶的行為木柬,推薦信息給當(dāng)前用戶皆串;
協(xié)同過濾推薦模型包含三種協(xié)同類型:1)、基于用戶的協(xié)同過濾眉枕;2)恶复、基于項目(內(nèi)容)的協(xié)同過濾;3)速挑、基于模型的協(xié)同過濾寂玲;
-----------------------------------------------------------------------------------------------------------------------------------------------
下面我們詳細(xì)介紹這三種類型的推薦算法是怎么實現(xiàn)推薦的,推薦原理是怎么樣的梗摇;
1)、基于用戶的協(xié)同過濾想许;
基于用戶的協(xié)同過濾是利用數(shù)據(jù)統(tǒng)計找到與目標(biāo)用戶有著相同喜好的相似用戶伶授,根據(jù)目標(biāo)用戶的相似用戶的喜好產(chǎn)生向目標(biāo)用戶的推薦內(nèi)容;到底是怎么實現(xiàn)的流纹;
我們來做一個假設(shè):
用戶1(運(yùn)營)喜歡書籍A糜烹、書籍C;
用戶2(測試)喜歡書籍B漱凝;
用戶3(產(chǎn)品)喜歡書籍A疮蹦、書籍C、書籍D茸炒;
通過數(shù)據(jù)(用戶之間多維空間中兩個向量夾角的余弦公式)我們發(fā)現(xiàn)用戶1(運(yùn)營)和用戶3(產(chǎn)品)喜好比較相似愕乎,同時我們發(fā)現(xiàn)用戶3喜歡書籍D阵苇,我們預(yù)測用戶1也會喜歡書籍D,那么這個時候我們就可以把書籍D推薦給用戶1感论;這就是基于用戶的協(xié)同過濾推薦绅项;
-----------------------------------------------------------------------------------------------------------------------------------------------
2)、基于項目(內(nèi)容)的協(xié)同過濾比肄;
基于內(nèi)容的協(xié)同過濾是利用數(shù)據(jù)統(tǒng)計找到歷史用戶對歷史消費(fèi)信息的評價數(shù)據(jù)值快耿,發(fā)掘信息與信息之間的相似度,根據(jù)目標(biāo)用戶的歷史消費(fèi)行為喜好將相似的信息推薦給目標(biāo)用戶芳绩;到底是怎么實現(xiàn)的掀亥;
我們來做一個假設(shè):
用戶1喜歡電影A(戰(zhàn)爭片)、電影C(戰(zhàn)爭片)妥色;
用戶2喜歡電影A(戰(zhàn)爭片)搪花、電影B(愛情片)、電影C(戰(zhàn)爭片)垛膝;
用戶3喜歡電影A(戰(zhàn)爭片)鳍侣;
通過數(shù)據(jù)(內(nèi)容之間多維空間中兩個向量夾角的余弦公式)我們發(fā)現(xiàn)電影A和電影C有著相似的信息屬性,同為戰(zhàn)爭片吼拥,喜歡電影A的用戶都喜歡電影C倚聚,基于這兩者之間的數(shù)據(jù)關(guān)聯(lián)關(guān)系,我們發(fā)現(xiàn)用戶3喜歡電影A,所以我們預(yù)測用戶3也會喜歡電影C凿可,那么這個時候我們就可以把電影C推薦給用戶3惑折;這就是基于內(nèi)容的協(xié)同過濾;
-----------------------------------------------------------------------------------------------------------------------------------------------
3)枯跑、基于模型的協(xié)同過濾惨驶;
基于模型的協(xié)同過濾是目前最主流的協(xié)同過濾類型,該種推薦類型的模型是我們有m個物品敛助、m個用戶的數(shù)據(jù)粗卜,只有部分用戶和部分?jǐn)?shù)據(jù)之間是有評分?jǐn)?shù)據(jù)的,其它部分評分是空白纳击;此時我們要用已有的部分稀疏數(shù)據(jù)來預(yù)測那些空白的物品和數(shù)據(jù)之間的評分關(guān)系续扔,找到最高評分的物品推薦給目標(biāo)用戶;
基于模型的協(xié)同過濾推薦是基于樣本數(shù)據(jù)用戶喜好信息焕数,訓(xùn)練并建立一個推薦模型纱昧,然后根據(jù)實時的目標(biāo)用戶喜好信息進(jìn)行預(yù)測推薦;這個類型的推薦算法就利用到了機(jī)器學(xué)習(xí)模塊堡赔;這里不做過多介紹识脆;
-----------------------------------------------------------------------------------------------------------------------------------------------
通過對上述三種協(xié)同過濾類型的分析,我們簡單總結(jié)一下這幾種推薦類型的原理;
1)灼捂、基于用戶的協(xié)同過濾主要考慮的是用戶和用戶之間的相似度离例,找出相似用戶喜歡的物品,并預(yù)測目標(biāo)用戶對應(yīng)物品的評分纵东,就可以把評分最高的若干個物品推薦給目標(biāo)用戶粘招;比如某用戶(運(yùn)營類型)在網(wǎng)站買了一些運(yùn)營的書籍,另一個用戶(有著運(yùn)營標(biāo)簽)來網(wǎng)站偎球,網(wǎng)站就會推薦大量運(yùn)營的書籍給他洒扎;
2)、基于項目(內(nèi)容)的協(xié)同過濾主要考慮的是物品和物品之間的相似度衰絮,找到目標(biāo)用戶對某些物品的評分袍冷,就可以對相似度高的類似物品進(jìn)行預(yù)測,將評分最高的若干個相似物品推薦給目標(biāo)用戶猫牡;比如某用戶在網(wǎng)上買了一些大數(shù)據(jù)方面的書籍胡诗,網(wǎng)站就會推薦大量大數(shù)據(jù)、云計算淌友、機(jī)器學(xué)習(xí)的書籍給他煌恢;
3)、基于項目的協(xié)同過濾是基于樣本數(shù)據(jù)用戶喜好信息震庭,訓(xùn)練并建立一個推薦模型瑰抵,然后根據(jù)實時的目標(biāo)用戶喜好信息進(jìn)行預(yù)測推薦;這個類型的推薦算法利用到了機(jī)器學(xué)習(xí)模塊器联,這里不做過多介紹二汛;
-----------------------------------------------------------------------------------------------------------------------------------------------
我們對基于用戶的協(xié)同過濾和基于內(nèi)容的協(xié)同過濾做一個簡單的對比,了解一下兩者的優(yōu)勢與劣勢拨拓;(由于基于模型的協(xié)同過濾涉及到機(jī)器學(xué)習(xí)建模肴颊,這里不做介紹)
1)、基于用戶的協(xié)同過濾:劣勢是需要在線實時發(fā)掘用戶和用戶之間的相似度關(guān)系渣磷,計算復(fù)雜度非常高婿着;優(yōu)勢是可以幫助用戶找到新類別喜好的物品;
2)醋界、基于項目(內(nèi)容)的協(xié)同過濾:優(yōu)勢是物品之間的相似度長時間不會有大改變祟身,因此對計算的實時要求不高完全可以線下計算,由于計算量完全所以推薦準(zhǔn)確度非常高物独;劣勢是由于都是基相似內(nèi)容之間的關(guān)聯(lián)性做推薦,所以很難給用戶推薦新的興趣點的內(nèi)容氯葬;
-----------------------------------------------------------------------------------------------------------------------------------------------
這是個性化推薦系統(tǒng)系列的第4篇挡篓,該系列一共有5篇:1、《個性化推薦系列之初步認(rèn)識推薦系統(tǒng)》;2官研、《個性化推薦系列之初步認(rèn)識機(jī)器學(xué)習(xí)》秽澳;3、《個性化推薦系列之推薦系統(tǒng)的演化及常見推薦算法》戏羽;4担神、《個性化推薦系列之協(xié)同過濾推薦算法總結(jié)》;5始花、《個性化推薦系列之推薦算法實踐》妄讯;
詳見知乎專欄--產(chǎn)品打雜https://zhuanlan.zhihu.com/zhoulink