基于用戶的協(xié)同過濾是怎么推薦電影的蚁廓?

我們平時在瀏覽電商、視頻等網(wǎng)站時厨幻,網(wǎng)頁一般會有一個“猜你喜歡”相嵌,也就是”智能推薦系統(tǒng)“,雖然一般來說推薦的不是很準確况脆,但是程Sir還是研究了一下這個玩意是怎么弄出來的……今天說一說最簡單的一個實現(xiàn)方法饭宾,叫做基于用戶的協(xié)同過濾

假設有幾個人分別看了如下電影并且給電影有如下評分(5分最高格了,沒看過的不評分)看铆,我們目的是要向A用戶推薦一部電影:

Score

協(xié)同過濾的整體思路只有兩步,非常簡單:尋找相似用戶盛末,推薦電影

尋找相似用戶####

所謂相似弹惦,其實是對于電影品味的相似,也就是說需要將A與其他幾位用戶做比較满败,判斷是不是品味相似肤频。有很多種方法可以用來判斷相似性叹括,(與我之前寫的K-Means文章中判斷兩點是否類似的方法是一致的)這篇文章用“歐幾里德距離”來做相似性判定算墨。

我們把每一部電影看成N維空間中的一個維度,這樣每個用戶對于電影的評分相當于維度的坐標汁雷,那么每一個用戶的所有評分净嘀,相當于就把用戶固定在這個N維空間的一個點上,然后利用歐幾里德距離計算N維空間兩點的距離:每一個電影的評分求差值侠讯,然后求每個差值的平方挖藏,然后求平方的和,然后在開平方厢漩。距離越短說明品味越接近膜眠。

本例中A只看過兩部電影(《老炮兒》和《唐人街探案》),因此只能通過這兩部電影來判斷品味了,那么計算A和其他幾位的距離:

distance

然后我們做一個變換宵膨,變換方法為:相似性 = 1/(1+歐幾里德距離)架谎,這個相似性會落在【0,1】區(qū)間內辟躏,1表示完全品味一樣谷扣,0表示完全品味不一樣。這時我們就可以找到哪些人的品味和A最為接近了捎琐,計算后如下:
相似性:B-0.27会涎,C-0.28,D-0.27瑞凑,E-0.50末秃,F(xiàn)-0.25,G-0.47
可見籽御,E的口味與A最為接近蛔溃,其次是G

推薦電影####

要做電影加權評分推薦。意思是說篱蝇,品味相近的人對于電影的評價對A選擇電影來說更加重要贺待,具體做法可以列一個表,計算加權分:

weighted

把相似性和對于每個電影的實際評分相乘零截,就是電影的加權分:
conclusion

加權后麸塞,還要做少量的計算:總分是每個電影加權分的總和,總相似度是對這個電影有評分的人的相似性綜合涧衙,推薦度是總分/總相似性哪工,目的是排除看電影人數(shù)對于總分的影響
結論在最終一行,就是電影的推薦度(因為是根據(jù)品味相同的人打分加權算出的分弧哎,可以近似認為如果A看了這部電影雁比,預期的評分會是多少)。

有了電影的加權得分撤嫩,通常做法還要設定一個閾值偎捎,如果超過了閾值再給用戶推薦,要不怎么推薦都是爛片序攘,如果這里我們設置閾值為4茴她,那么最終推薦給A的電影就是《尋龍訣》。

我們現(xiàn)在的做法是向用戶推薦電影程奠。當然還可以從另外角度來思考:如果我們把一開始的評分表的行列調換丈牢,其他過程都不變,那么就變成了把電影推薦給合適的受眾瞄沙。因此己沛,要根據(jù)不同場景選擇不同的思考維度慌核。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市申尼,隨后出現(xiàn)的幾起案子遂铡,更是在濱河造成了極大的恐慌,老刑警劉巖晶姊,帶你破解...
    沈念sama閱讀 217,509評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件扒接,死亡現(xiàn)場離奇詭異,居然都是意外死亡们衙,警方通過查閱死者的電腦和手機钾怔,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評論 3 394
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蒙挑,“玉大人宗侦,你說我怎么就攤上這事∫涫矗” “怎么了矾利?”我有些...
    開封第一講書人閱讀 163,875評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長馋袜。 經(jīng)常有香客問我男旗,道長,這世上最難降的妖魔是什么欣鳖? 我笑而不...
    開封第一講書人閱讀 58,441評論 1 293
  • 正文 為了忘掉前任察皇,我火速辦了婚禮,結果婚禮上泽台,老公的妹妹穿的比我還像新娘什荣。我一直安慰自己,他們只是感情好怀酷,可當我...
    茶點故事閱讀 67,488評論 6 392
  • 文/花漫 我一把揭開白布稻爬。 她就那樣靜靜地躺著,像睡著了一般蜕依。 火紅的嫁衣襯著肌膚如雪桅锄。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,365評論 1 302
  • 那天笔横,我揣著相機與錄音竞滓,去河邊找鬼。 笑死吹缔,一個胖子當著我的面吹牛,可吹牛的內容都是我干的锯茄。 我是一名探鬼主播厢塘,決...
    沈念sama閱讀 40,190評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼茶没,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了晚碾?” 一聲冷哼從身側響起抓半,我...
    開封第一講書人閱讀 39,062評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎格嘁,沒想到半個月后笛求,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,500評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡糕簿,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,706評論 3 335
  • 正文 我和宋清朗相戀三年探入,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片懂诗。...
    茶點故事閱讀 39,834評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡蜂嗽,死狀恐怖,靈堂內的尸體忽然破棺而出殃恒,到底是詐尸還是另有隱情植旧,我是刑警寧澤,帶...
    沈念sama閱讀 35,559評論 5 345
  • 正文 年R本政府宣布离唐,位于F島的核電站病附,受9級特大地震影響,放射性物質發(fā)生泄漏亥鬓。R本人自食惡果不足惜胖喳,卻給世界環(huán)境...
    茶點故事閱讀 41,167評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望贮竟。 院中可真熱鬧丽焊,春花似錦、人聲如沸咕别。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽惰拱。三九已至雌贱,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間偿短,已是汗流浹背欣孤。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留昔逗,地道東北人降传。 一個月前我還...
    沈念sama閱讀 47,958評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像勾怒,于是被迫代替她去往敵國和親婆排。 傳聞我的和親對象是個殘疾皇子声旺,可洞房花燭夜當晚...
    茶點故事閱讀 44,779評論 2 354

推薦閱讀更多精彩內容