看到“內(nèi)容推薦”幾個字的時候棵逊,腦海里第一時間浮出的印象:猜你喜歡寝贡,購買這本書的用戶還購買了...,瀏覽這件商品的用戶還瀏覽了哪些商品等等諸如此類乐导;“協(xié)同過濾推薦”剛好用于解決這樣的問題——發(fā)現(xiàn)用戶與產(chǎn)品的匹配度,將產(chǎn)品或服務準確的推薦給用戶摩窃;
基于用戶過濾
將“相似”的用戶挖掘出來兽叮,并將用戶已經(jīng)購買過的產(chǎn)品推薦和他“相似”的 用戶。例如:一個30歲的男性消費過一塊手表猾愿,則可以對另一個與其相似的年齡大男性 推薦同樣的手表鹦聪。
基于產(chǎn)品過濾
過濾“相似”的商品,用戶消費時蒂秘,將他已經(jīng)購買過的產(chǎn)品的“相似”產(chǎn)品 推薦給他泽本。例如:你購買或搜索過《人人都是產(chǎn)品經(jīng)理》,則會對你推薦《產(chǎn)品經(jīng)理手冊》姻僧、《結(jié)網(wǎng)》规丽、《啟示錄》等相關的產(chǎn)品經(jīng)理的書籍。
基于協(xié)同過濾
將用戶對產(chǎn)品的的偏好數(shù)據(jù)進行建模撇贺,對喜好“相似”的用戶進行過濾赌莺,也可以對屬性“相似”的產(chǎn)品過濾,或者對未知的“用戶-產(chǎn)品”進行喜好松嘶、相似度計算艘狭,這種過濾是“協(xié)同”的。例如:如果用戶對購買過多款產(chǎn)品或觀看了多篇文章翠订,可以基于模型對那些他未購買過的商品或未閱讀的文章估計他的喜好度巢音,進而用于產(chǎn)品推薦;
收集用戶偏好
對某商品的用戶對于某商品的購買尽超、評分官撼、對某文章轉(zhuǎn)發(fā) 、點擊量似谁、頁面停留的時間等可以反映用戶偏好傲绣。購買、評分巩踏、投票斜筐、 轉(zhuǎn)發(fā)等,可以比較精確地得到用戶對于商品的偏好信息蛀缝,而點擊量、頁面停留則含有噪聲目代,需要對這類數(shù)據(jù)事先進行處理屈梁,而對于用戶評論嗤练,則需要進行文本分析從得知用戶的情感傾向,從而可以一定程度地反應用戶的偏好程度在讶;
評分矩陣
在得到每個用戶的偏好后煞抬,就可以進一步分析用戶之間的相似情況;為了便于理解构哺,我們將用戶對平臺內(nèi)所有商品的喜好度設為0革答,然后將用戶購買過的商品與其的喜好度設為1;
其中曙强,列表示某用戶残拐,行表示商品,單元格內(nèi)的分數(shù)代表用戶對商品的偏好〉欤現(xiàn)在用戶yang對6種商品偏好為0溪食、1、1娜扇、0错沃、1、1雀瓢,需要找出與該用戶最相似的前三個用戶
相似度計算
杰卡德(Jaccard)相似度用于衡量兩個集合的相似情況枢析,即兩個集合的交集元素的個 數(shù)除以并集元素的個數(shù)。
其中A刃麸、B代表兩個集合醒叁。
我們用易于理解對杰卡德(Jaccard)相似度公式計算相似度哈;
基于用戶對協(xié)同過濾
沿用之前的數(shù)據(jù)嫌蚤,對于新用戶yang辐益,其對6個商品的購買情況為1、1脱吱、0智政、0、0箱蝠、1续捂,通過Jaccard相似度計算yang于其他用戶對相似度,從大到小排序;
取前三個用戶為鄰近用戶宦搬,即用戶sun牙瓢、用戶zhao、用戶Li间校。此時以每個鄰近用戶的相似度為權(quán)重矾克,與相應物品的喜好度進行相乘,計算出商品推薦打分憔足。例如胁附,對于yang未購買過而其他用戶購買過的商品C酒繁,其商品推薦打分計算為?
前三個臨近用戶中:sun和zhao對商品c對喜好度為1控妻,li對商品c的喜好度為0州袒;
因此用戶yang的商品C推薦得分 = 1 * 0.67 + 1 * 0.5 + 0 * 0.5 = 1.17;
用戶yang的商品D推薦得分 = 1 * 0.67 + 0 * 0.5 + 0 * 0.5 = 0.67
用戶yang的商品E推薦得分 = 1 * 0.67 + 1 * 0.5 + 0 * 0.5 = 1.17
基于商品協(xié)同過濾
依然通過Jaccard公式計算商品與商品間的相似度弓候,即兩個集合的交集元素的個 數(shù)除以并集元素的個數(shù)郎哭。
例如 計算商品A與商品B對相似度,交集數(shù)量為3個菇存,并集為9夸研,因此相似度為3/9 = 0.33
以此類推
剛剛提到的用戶yang對6種商品偏好為0、1撰筷、1陈惰、0、1毕籽、1抬闯,需要找出與該用戶最相似的前三個用戶
基于商品的協(xié)同過濾會以商品的相似度為權(quán)重,在本例中以用戶yang的商品喜好度為基礎 关筒,計算商品推薦打分溶握,例如用戶yang未購買的商品C,其計算公式應為:
0 * 0.56 + 1 * 0.56 + 1 * 1 + 0 * 0.33 + 1 * 0.33 + 1 * 0.44 = 2.33蒸播;
商品D = 0.99
商品E = 1.99
因此睡榆,基于商品的協(xié)同過濾會依次向用戶yang推薦商品C、商品E和商品D袍榆。