Item CF的算法實(shí)例

一吏颖、基本原理

基于物品的 CF 的原理和基于用戶的 CF 類似，只是在計(jì)算鄰居時(shí)采用物品本身恨樟，而不是從用戶的角度半醉，即基于用戶對(duì)物品的偏好找到相似的物品，然后根據(jù)用戶的歷史偏好劝术，推薦相似的物品給他缩多。從計(jì)算的角度看，就是將所有用戶對(duì)某個(gè)物品的偏好作為一個(gè)向量來(lái)計(jì)算物品之間的相似度养晋，得到物品的相似物品后衬吆，根據(jù)用戶歷史的偏好預(yù)測(cè)當(dāng)前用戶還沒(méi)有表示偏好的物品，計(jì)算得到一個(gè)排序的物品列表作為推薦绳泉。圖 3 給出了一個(gè)例子逊抡，對(duì)于物品 A，根據(jù)所有用戶的歷史偏好零酪，喜歡物品 A 的用戶都喜歡物品 C冒嫡，得出物品 A 和物品 C 比較相似拇勃，而用戶 C 喜歡物品 A，那么可以推斷出用戶 C 可能也喜歡物品 C孝凌。

圖 3.基于物品的 CF 的基本原理

根據(jù)用戶的歷史喜好推斷出A方咆、C

二、算法實(shí)現(xiàn)

首先計(jì)算物品之間的相似度蟀架，然后根據(jù)物品的相似度和用戶的歷史行為給用戶生成推薦列表

步驟

1. 建立物品的同現(xiàn)矩陣

2. 建立用戶對(duì)物品的評(píng)分矩陣

3. 矩陣計(jì)算推薦結(jié)果

拿Mahout In Action中的案例說(shuō)明

測(cè)試數(shù)據(jù)：

1,101,5.0

1,102,3.0

1,103,2.5

2,101,2.0

2,102,2.5

2,103,5.0

2,104,2.0

3,101,2.5

3,104,4.0

3,105,4.5

3,107,5.0

4,101,5.0

4,103,3.0

4,104,4.5

4,106,4.0

5,101,4.0

5,102,3.0

5,103,2.0

5,104,4.0

5,105,3.5

5,106,4.0

針對(duì)這樣一個(gè)原始數(shù)據(jù)瓣赂，我們采取以下處理方式，按步驟獲取用戶3的推薦列表：

第一片拍，我們整理出物品評(píng)分矩陣钩述，這其實(shí)是原始數(shù)據(jù)。

用戶物品評(píng)分矩陣

第二穆碎，我們整理出物品同現(xiàn)矩陣，這是item CF的思想所在：同現(xiàn)高的物品职恳，相關(guān)性高所禀。

物品同現(xiàn)矩陣

第三，我們整理出用戶評(píng)分矩陣放钦，這顯示了用戶偏好色徘。

用戶評(píng)分矩陣

第四，我們使用物品的相似度操禀，與用戶當(dāng)前的瀏覽記錄進(jìn)行關(guān)聯(lián)褂策，計(jì)算得到推薦列表。

物品推薦計(jì)算

這樣就計(jì)算得到了用戶3的物品待推薦物品及評(píng)分颓屑，我們可以根據(jù)實(shí)際情況按得分降序選擇推薦物品斤寂。

從上面我們可以看出，Item CF算法對(duì)新用戶是友好的揪惦，只要用戶偏好矩陣不為0遍搞，即用戶有歷史偏好記錄，就能夠很快得到推薦器腋。但對(duì)新物品不友好溪猿，因?yàn)樾挛锲窙](méi)有歷史數(shù)據(jù)，難以得到推薦纫塌。這可以應(yīng)用到音樂(lè)項(xiàng)目中诊县，因?yàn)橐魳?lè)曲庫(kù)相對(duì)來(lái)說(shuō)比較固定，新物品相對(duì)較少措左，這可以使得新用戶快速獲得符合自己口味的音樂(lè)依痊。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市媳荒，隨后出現(xiàn)的幾起案子抗悍，更是在濱河造成了極大的恐慌驹饺，老刑警劉巖，帶你破解...
沈念sama閱讀 219,270評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件缴渊，死亡現(xiàn)場(chǎng)離奇詭異赏壹，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)衔沼，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,489評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門蝌借，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人指蚁，你說(shuō)我怎么就攤上這事菩佑。” “怎么了凝化？”我有些...
開(kāi)封第一講書(shū)人閱讀 165,630評(píng)論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵稍坯，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我搓劫，道長(zhǎng)瞧哟，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,906評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任枪向，我火速辦了婚禮勤揩，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘秘蛔。我一直安慰自己陨亡，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,928評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布深员。她就那樣靜靜地躺著负蠕，像睡著了一般。火紅的嫁衣襯著肌膚如雪倦畅。梳的紋絲不亂的頭發(fā)上虐急，一...
開(kāi)封第一講書(shū)人閱讀 51,718評(píng)論 1贊 305
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音滔迈，去河邊找鬼止吁。笑死，一個(gè)胖子當(dāng)著我的面吹牛燎悍，可吹牛的內(nèi)容都是我干的敬惦。我是一名探鬼主播，決...
沈念sama閱讀 40,442評(píng)論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼谈山，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼俄删！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 39,345評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤畴椰，失蹤者是張志新（化名）和其女友劉穎臊诊，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體斜脂，經(jīng)...
沈念sama閱讀 45,802評(píng)論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡抓艳，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,984評(píng)論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了帚戳。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片玷或。...
茶點(diǎn)故事閱讀 40,117評(píng)論 1贊 351
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖片任，靈堂內(nèi)的尸體忽然破棺而出偏友，到底是詐尸還是另有隱情，我是刑警寧澤对供，帶...
沈念sama閱讀 35,810評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布位他，位于F島的核電站，受9級(jí)特大地震影響产场，放射性物質(zhì)發(fā)生泄漏棱诱。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,462評(píng)論 3贊 331
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一涝动、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧炬灭，春花似錦醋粟、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,011評(píng)論 0贊 22
一樁弒父案米愿，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至鼻吮，卻和暖如春育苟，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背椎木。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,139評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工违柏，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人香椎。一個(gè)月前我還...
沈念sama閱讀 48,377評(píng)論 3贊 373
代替公主和親
正文我出身青樓漱竖，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親畜伐。傳聞我的和親對(duì)象是個(gè)殘疾皇子馍惹，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,060評(píng)論 2贊 355

Item CF的算法實(shí)例

推薦閱讀更多精彩內(nèi)容