基于用戶的協(xié)同過濾是怎么推薦電影的蚁廓？

我們平時在瀏覽電商、視頻等網(wǎng)站時厨幻，網(wǎng)頁一般會有一個“猜你喜歡”相嵌，也就是”智能推薦系統(tǒng)“，雖然一般來說推薦的不是很準確况脆，但是程Sir還是研究了一下這個玩意是怎么弄出來的……今天說一說最簡單的一個實現(xiàn)方法饭宾，叫做基于用戶的協(xié)同過濾。

假設有幾個人分別看了如下電影并且給電影有如下評分（5分最高格了，沒看過的不評分）看铆，我們目的是要向A用戶推薦一部電影：

Score

協(xié)同過濾的整體思路只有兩步，非常簡單：尋找相似用戶盛末，推薦電影

尋找相似用戶####

所謂相似弹惦，其實是對于電影品味的相似，也就是說需要將A與其他幾位用戶做比較满败，判斷是不是品味相似肤频。有很多種方法可以用來判斷相似性叹括，（與我之前寫的K-Means文章中判斷兩點是否類似的方法是一致的）這篇文章用“歐幾里德距離”來做相似性判定算墨。

我們把每一部電影看成N維空間中的一個維度，這樣每個用戶對于電影的評分相當于維度的坐標汁雷，那么每一個用戶的所有評分净嘀，相當于就把用戶固定在這個N維空間的一個點上，然后利用歐幾里德距離計算N維空間兩點的距離：每一個電影的評分求差值侠讯，然后求每個差值的平方挖藏，然后求平方的和，然后在開平方厢漩。距離越短說明品味越接近膜眠。

本例中A只看過兩部電影（《老炮兒》和《唐人街探案》），因此只能通過這兩部電影來判斷品味了，那么計算A和其他幾位的距離：

distance

然后我們做一個變換宵膨，變換方法為：相似性 = 1/(1+歐幾里德距離)架谎，這個相似性會落在【0，1】區(qū)間內辟躏，1表示完全品味一樣谷扣，0表示完全品味不一樣。這時我們就可以找到哪些人的品味和A最為接近了捎琐，計算后如下：
相似性：B-0.27会涎，C-0.28，D-0.27瑞凑，E-0.50末秃，F(xiàn)-0.25，G-0.47
可見籽御，E的口味與A最為接近蛔溃，其次是G

推薦電影####

要做電影加權評分推薦。意思是說篱蝇，品味相近的人對于電影的評價對A選擇電影來說更加重要贺待，具體做法可以列一個表，計算加權分：

weighted

把相似性和對于每個電影的實際評分相乘零截，就是電影的加權分:

conclusion

加權后麸塞，還要做少量的計算：總分是每個電影加權分的總和，總相似度是對這個電影有評分的人的相似性綜合涧衙，推薦度是總分/總相似性哪工，目的是排除看電影人數(shù)對于總分的影響
結論在最終一行，就是電影的推薦度（因為是根據(jù)品味相同的人打分加權算出的分弧哎，可以近似認為如果A看了這部電影雁比，預期的評分會是多少）。

有了電影的加權得分撤嫩，通常做法還要設定一個閾值偎捎，如果超過了閾值再給用戶推薦，要不怎么推薦都是爛片序攘，如果這里我們設置閾值為4茴她，那么最終推薦給A的電影就是《尋龍訣》。

我們現(xiàn)在的做法是向用戶推薦電影程奠。當然還可以從另外角度來思考：如果我們把一開始的評分表的行列調換丈牢，其他過程都不變，那么就變成了把電影推薦給合適的受眾瞄沙。因此己沛，要根據(jù)不同場景選擇不同的思考維度慌核。

最后編輯于：2017.11.27 06:11:53

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市申尼，隨后出現(xiàn)的幾起案子遂铡，更是在濱河造成了極大的恐慌，老刑警劉巖晶姊，帶你破解...
沈念sama閱讀 217,509評論 6贊 504
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件扒接，死亡現(xiàn)場離奇詭異，居然都是意外死亡们衙，警方通過查閱死者的電腦和手機钾怔，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,806評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來蒙挑，“玉大人宗侦，你說我怎么就攤上這事∫涫矗” “怎么了矾利？”我有些...
開封第一講書人閱讀 163,875評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長馋袜。經(jīng)常有香客問我男旗，道長，這世上最難降的妖魔是什么欣鳖？我笑而不...
開封第一講書人閱讀 58,441評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任察皇，我火速辦了婚禮，結果婚禮上泽台，老公的妹妹穿的比我還像新娘什荣。我一直安慰自己，他們只是感情好怀酷，可當我...
茶點故事閱讀 67,488評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布稻爬。她就那樣靜靜地躺著，像睡著了一般蜕依。火紅的嫁衣襯著肌膚如雪桅锄。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,365評論 1贊 302
城市分裂傳說
那天笔横，我揣著相機與錄音竞滓，去河邊找鬼。笑死吹缔，一個胖子當著我的面吹牛，可吹牛的內容都是我干的锯茄。我是一名探鬼主播厢塘，決...
沈念sama閱讀 40,190評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼茶没，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了晚碾？” 一聲冷哼從身側響起抓半，我...
開封第一講書人閱讀 39,062評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎格嘁，沒想到半個月后笛求，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,500評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡糕簿，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,706評論 3贊 335
?白月光啟示錄
正文我和宋清朗相戀三年探入，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片懂诗。...
茶點故事閱讀 39,834評論 1贊 347
活死人
序言：一個原本活蹦亂跳的男人離奇死亡蜂嗽，死狀恐怖，靈堂內的尸體忽然破棺而出殃恒，到底是詐尸還是另有隱情植旧，我是刑警寧澤，帶...
沈念sama閱讀 35,559評論 5贊 345
?日本核電站爆炸內幕
正文年R本政府宣布离唐，位于F島的核電站病附，受9級特大地震影響，放射性物質發(fā)生泄漏亥鬓。R本人自食惡果不足惜胖喳，卻給世界環(huán)境...
茶點故事閱讀 41,167評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望贮竟。院中可真熱鬧丽焊，春花似錦、人聲如沸咕别。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,779評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽惰拱。三九已至雌贱，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間偿短，已是汗流浹背欣孤。一陣腳步聲響...
開封第一講書人閱讀 32,912評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留昔逗，地道東北人降传。一個月前我還...
沈念sama閱讀 47,958評論 2贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像勾怒，于是被迫代替她去往敵國和親婆排。傳聞我的和親對象是個殘疾皇子声旺，可洞房花燭夜當晚...
茶點故事閱讀 44,779評論 2贊 354

基于用戶的協(xié)同過濾是怎么推薦電影的？

基于用戶的協(xié)同過濾是怎么推薦電影的蚁廓？

尋找相似用戶####

推薦電影####

推薦閱讀更多精彩內容