Item CF的算法實(shí)例

一吏颖、基本原理

基于物品的 CF 的原理和基于用戶的 CF 類似,只是在計(jì)算鄰居時(shí)采用物品本身恨樟,而不是從用戶的角度半醉,即基于用戶對(duì)物品的偏好找到相似的物品,然后根據(jù)用戶的歷史偏好劝术,推薦相似的物品給他缩多。從計(jì)算的角度看,就是將所有用戶對(duì)某個(gè)物品的偏好作為一個(gè)向量來(lái)計(jì)算物品之間的相似度养晋,得到物品的相似物品后衬吆,根據(jù)用戶歷史的偏好預(yù)測(cè)當(dāng)前用戶還沒(méi)有表示偏好的物品,計(jì)算得到一個(gè)排序的物品列表作為推薦绳泉。圖 3 給出了一個(gè)例子逊抡,對(duì)于物品 A,根據(jù)所有用戶的歷史偏好零酪,喜歡物品 A 的用戶都喜歡物品 C冒嫡,得出物品 A 和物品 C 比較相似拇勃,而用戶 C 喜歡物品 A,那么可以推斷出用戶 C 可能也喜歡物品 C孝凌。

圖 3.基于物品的 CF 的基本原理

根據(jù)用戶的歷史喜好推斷出A方咆、C

二、算法實(shí)現(xiàn)

首先計(jì)算物品之間的相似度蟀架,然后根據(jù)物品的相似度和用戶的歷史行為給用戶生成推薦列表

步驟

1. 建立物品的同現(xiàn)矩陣

2. 建立用戶對(duì)物品的評(píng)分矩陣

3. 矩陣計(jì)算推薦結(jié)果

拿Mahout In Action中的案例說(shuō)明

測(cè)試數(shù)據(jù):

1,101,5.0

1,102,3.0

1,103,2.5

2,101,2.0

2,102,2.5

2,103,5.0

2,104,2.0

3,101,2.5

3,104,4.0

3,105,4.5

3,107,5.0

4,101,5.0

4,103,3.0

4,104,4.5

4,106,4.0

5,101,4.0

5,102,3.0

5,103,2.0

5,104,4.0

5,105,3.5

5,106,4.0

針對(duì)這樣一個(gè)原始數(shù)據(jù)瓣赂,我們采取以下處理方式,按步驟獲取用戶3的推薦列表:

第一片拍,我們整理出物品評(píng)分矩陣钩述,這其實(shí)是原始數(shù)據(jù)。

用戶物品評(píng)分矩陣

第二穆碎,我們整理出物品同現(xiàn)矩陣,這是item CF的思想所在:同現(xiàn)高的物品职恳,相關(guān)性高所禀。

物品同現(xiàn)矩陣

第三,我們整理出用戶評(píng)分矩陣放钦,這顯示了用戶偏好色徘。

用戶評(píng)分矩陣


第四,我們使用物品的相似度操禀,與用戶當(dāng)前的瀏覽記錄進(jìn)行關(guān)聯(lián)褂策,計(jì)算得到推薦列表。

物品推薦計(jì)算

這樣就計(jì)算得到了用戶3的物品待推薦物品及評(píng)分颓屑,我們可以根據(jù)實(shí)際情況按得分降序選擇推薦物品斤寂。

從上面我們可以看出,Item CF算法對(duì)新用戶是友好的揪惦,只要用戶偏好矩陣不為0遍搞,即用戶有歷史偏好記錄,就能夠很快得到推薦器腋。但對(duì)新物品不友好溪猿,因?yàn)樾挛锲窙](méi)有歷史數(shù)據(jù),難以得到推薦纫塌。這可以應(yīng)用到音樂(lè)項(xiàng)目中诊县,因?yàn)橐魳?lè)曲庫(kù)相對(duì)來(lái)說(shuō)比較固定,新物品相對(duì)較少措左,這可以使得新用戶快速獲得符合自己口味的音樂(lè)依痊。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市媳荒,隨后出現(xiàn)的幾起案子抗悍,更是在濱河造成了極大的恐慌驹饺,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,270評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件缴渊,死亡現(xiàn)場(chǎng)離奇詭異赏壹,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)衔沼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門蝌借,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人指蚁,你說(shuō)我怎么就攤上這事菩佑。” “怎么了凝化?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,630評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵稍坯,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我搓劫,道長(zhǎng)瞧哟,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,906評(píng)論 1 295
  • 正文 為了忘掉前任枪向,我火速辦了婚禮勤揩,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘秘蛔。我一直安慰自己陨亡,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,928評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布深员。 她就那樣靜靜地躺著负蠕,像睡著了一般。 火紅的嫁衣襯著肌膚如雪倦畅。 梳的紋絲不亂的頭發(fā)上虐急,一...
    開(kāi)封第一講書(shū)人閱讀 51,718評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音滔迈,去河邊找鬼止吁。 笑死,一個(gè)胖子當(dāng)著我的面吹牛燎悍,可吹牛的內(nèi)容都是我干的敬惦。 我是一名探鬼主播,決...
    沈念sama閱讀 40,442評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼谈山,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼俄删!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,345評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤畴椰,失蹤者是張志新(化名)和其女友劉穎臊诊,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體斜脂,經(jīng)...
    沈念sama閱讀 45,802評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡抓艳,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,984評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了帚戳。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片玷或。...
    茶點(diǎn)故事閱讀 40,117評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖片任,靈堂內(nèi)的尸體忽然破棺而出偏友,到底是詐尸還是另有隱情,我是刑警寧澤对供,帶...
    沈念sama閱讀 35,810評(píng)論 5 346
  • 正文 年R本政府宣布位他,位于F島的核電站,受9級(jí)特大地震影響产场,放射性物質(zhì)發(fā)生泄漏棱诱。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,462評(píng)論 3 331
  • 文/蒙蒙 一涝动、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧炬灭,春花似錦醋粟、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,011評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至鼻吮,卻和暖如春育苟,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背椎木。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,139評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工违柏, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人香椎。 一個(gè)月前我還...
    沈念sama閱讀 48,377評(píng)論 3 373
  • 正文 我出身青樓漱竖,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親畜伐。 傳聞我的和親對(duì)象是個(gè)殘疾皇子馍惹,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,060評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容