PM個性化推薦總結(jié)(二)——詳細(xì)理解協(xié)同過濾推薦

個性化推薦本質(zhì)上是一個主動幫助目標(biāo)用戶找到目標(biāo)商品的過程寝优,商品在被推薦系統(tǒng)呈現(xiàn)到用戶面前之前,往往經(jīng)歷以下幾個步驟:

初步召回進(jìn)入候選池——按用戶喜愛程度/消費(fèi)意愿大小排序——在此基礎(chǔ)上按人工規(guī)則策略重排序——以某種展示形式推出過程稚失。

大家耳熟能詳?shù)膮f(xié)同過濾、矩陣分解、基于內(nèi)容的CB等推薦法指的都是在物品初步召回進(jìn)入候選池這個過程中使用的方法。

其中協(xié)同過濾是個性化推薦最基本的方法妓笙,也是本文要講解的方法。

其他方法的理解可等待該系列的后續(xù)文章

產(chǎn)品經(jīng)理的推薦總結(jié)(三)——詳細(xì)理解以用戶畫像為主的基于內(nèi)容的推薦算法

產(chǎn)品經(jīng)理的推薦總結(jié)(四)——規(guī)則與策略在推薦中的應(yīng)用與作用

早期的協(xié)同過濾包含以用戶為基礎(chǔ)的協(xié)同過濾能岩,即user-based的協(xié)同過濾(user-cf)和以物品/項目為基礎(chǔ)的協(xié)同過濾寞宫,即item-based的協(xié)同過濾(item-cf)。

無論是user-cf還是item-cf都統(tǒng)稱為以記憶為基礎(chǔ)(Memory based)的協(xié)同過濾拉鹃。

在后來的Netflix競賽中辈赋,涌現(xiàn)了基于矩陣分解的算法鲫忍,這種算法被廣泛應(yīng)用,其模型被稱之為LFM模型钥屈,即為隱因子或者隱語義模型悟民。

協(xié)同過濾一路發(fā)展過來,獲得了很多拓展和補(bǔ)充篷就。

一.如何理解以及區(qū)分同以記憶為基礎(chǔ)的user-cf和item-cf射亏?

這種算法的思想是這樣的:推薦系統(tǒng)有兩個服務(wù)對象,一個是用戶竭业,一個是物品鸦泳,用戶與物品之間是需要關(guān)聯(lián)的橋梁媒介的,這個橋梁也只有兩個選擇永品,一個是用戶做鹰,一個是物品。user-cf與item-cf的本質(zhì)區(qū)別就在于是選擇用戶作為用戶-物品關(guān)系的橋梁鼎姐,還是物品作為用戶-物品關(guān)系的橋梁钾麸。

以下用“目標(biāo)用戶”“目標(biāo)物品”“橋梁用戶”“橋梁物品”描述算法概念。

uesr-cf選擇用戶作為用戶-物品關(guān)系橋梁

選擇用戶作為橋梁炕桨,需要完成兩個步驟:

1.建立目標(biāo)用戶與橋梁用戶的關(guān)系饭尝。

2.建立橋梁用戶與目標(biāo)物品的關(guān)系。

以上兩步完成献宫,便能成功的關(guān)聯(lián)目標(biāo)用戶與目標(biāo)物品钥平。

目標(biāo)用戶與橋梁用戶的關(guān)系如何確立:我們認(rèn)為喜愛同樣物品的用戶具有共同之處,此處的“喜愛同樣的物品”便是目標(biāo)用戶與橋梁用戶的“相似”關(guān)系姊途。

橋梁用戶與目標(biāo)物品的關(guān)系如何確定:我們認(rèn)為橋梁用戶喜愛某目標(biāo)物品涉瘾,此處的“喜愛”即代表橋梁用戶與目標(biāo)商品的關(guān)系。

示意圖如下:


選擇物品作為橋梁捷兰,也需要完成兩個步驟:

1.建立目標(biāo)用戶與橋梁物品的關(guān)系立叛。

2.建立橋梁物品與目標(biāo)物品的關(guān)系。

以上兩步完成贡茅,便能成功關(guān)聯(lián)目標(biāo)用戶與目標(biāo)物品秘蛇。

這里目標(biāo)用戶與橋梁物品,橋梁物品與目標(biāo)物品的關(guān)系顶考,跟上面的有相似之處赁还。

目標(biāo)用戶與橋梁物品的關(guān)系如何確立:我們認(rèn)為目標(biāo)用戶喜愛橋梁物品,此處的“喜愛”即代表目標(biāo)用戶與橋梁商品的關(guān)系驹沿。

橋梁物品與目標(biāo)物品的關(guān)系如何確定:我們認(rèn)為被同樣用戶喜愛的物品也會有共同之處艘策,此處“被同樣用戶喜愛”便是橋梁物品與目標(biāo)物品的“相似”關(guān)系。

示意圖如下:


對比兩個圖可以很清晰的看出甚负,基于記憶的協(xié)同過濾的原理都存在非常驚人的相同之處柬焕,這種相同之處可以抽象出統(tǒng)一的邏輯审残,在這種邏輯的具化過程中,兩種協(xié)同過濾澤呈現(xiàn)出具有對稱美感的異同之處斑举。

相同之處一:

都需要建立目標(biāo)用戶與目標(biāo)商品之間的關(guān)系搅轿。

異同之處一:

user-cf? 中間關(guān)系橋梁為“user”。

item-cf? 中間關(guān)系橋梁為“item”?富玷。

相同之處二:

相同類型的目標(biāo)的關(guān)系靠共同喜愛的物品或被共同用戶喜愛璧坟,不同類型的目標(biāo)關(guān)系靠用戶對物品的單項喜愛。

異同之處二:

user-cf? 相同類型的資源關(guān)系體現(xiàn)在目標(biāo)用戶與橋梁用戶之間赎懦,靠“共同喜愛的商品”建立雀鹃。

item-cf? 相同類型的資源關(guān)系體現(xiàn)在橋梁物品與目標(biāo)物品之間,靠“被共同的用戶喜愛”建立励两。

不同類型的資源關(guān)系黎茎,都指的是用戶資源與物品資源的關(guān)系,靠“用戶單向喜歡物品”建立当悔。

相同之處三:

無論是user-cf還是item-cf傅瞻,使用到的都是用戶的行為數(shù)據(jù),“喜愛”可以代表“點(diǎn)擊”“收藏”“購買”等行為盲憎,并不涉及用戶或者物品的內(nèi)容屬性數(shù)據(jù)嗅骄。

兩種基于記憶的協(xié)同過濾在使用場景上有各自的優(yōu)勢和劣勢,為什么會存在這種優(yōu)勢與劣勢饼疙,大家可以試試根據(jù)原理圖分析一下溺森。

二.如何理解基于矩陣分解的lfm模型

如果我們能得到一個用戶-物品的評分矩陣,包含所有用戶窑眯、所有物品屏积,以及用戶與物品一對一的單向打分。那就能輕松的完成將目標(biāo)商品推薦給目標(biāo)用戶的目的伸但。而在實際收集數(shù)據(jù)的過程中肾请,發(fā)現(xiàn)每個用戶的行為有限,因此只能得到一張稀疏的用戶對物品打分表更胖,如下圖所示。


LFM模型的思想是將每個用戶喜歡某個物品拆成兩個環(huán)節(jié):第一個環(huán)節(jié)是某個用戶喜歡某種元素隔显,第二個環(huán)節(jié)是這個元素被某個物品擁有却妨。這里的“元素”不需要人為標(biāo)注與構(gòu)建,稱之為“潛在因子”括眠。

通過這個理論彪标,采用矩陣分解的方法將用戶-物品矩陣拆分“用戶-潛在因子”矩陣”和“潛在因子-物品”矩陣,求解得到潛在因子和用戶掷豺、物品的關(guān)系捞烟,將剩余的“空白打分欄”補(bǔ)充完整薄声,就是lfm模型要解決的問題。

以上就是推薦方法中最常用的協(xié)同過濾法题画。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末默辨,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子苍息,更是在濱河造成了極大的恐慌缩幸,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,843評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件竞思,死亡現(xiàn)場離奇詭異表谊,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)盖喷,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,538評論 3 392
  • 文/潘曉璐 我一進(jìn)店門爆办,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人课梳,你說我怎么就攤上這事距辆。” “怎么了惦界?”我有些...
    開封第一講書人閱讀 163,187評論 0 353
  • 文/不壞的土叔 我叫張陵挑格,是天一觀的道長。 經(jīng)常有香客問我沾歪,道長漂彤,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,264評論 1 292
  • 正文 為了忘掉前任灾搏,我火速辦了婚禮挫望,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘狂窑。我一直安慰自己媳板,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,289評論 6 390
  • 文/花漫 我一把揭開白布泉哈。 她就那樣靜靜地躺著蛉幸,像睡著了一般。 火紅的嫁衣襯著肌膚如雪丛晦。 梳的紋絲不亂的頭發(fā)上奕纫,一...
    開封第一講書人閱讀 51,231評論 1 299
  • 那天,我揣著相機(jī)與錄音烫沙,去河邊找鬼匹层。 笑死,一個胖子當(dāng)著我的面吹牛锌蓄,可吹牛的內(nèi)容都是我干的升筏。 我是一名探鬼主播撑柔,決...
    沈念sama閱讀 40,116評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼您访!你這毒婦竟也來了铅忿?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,945評論 0 275
  • 序言:老撾萬榮一對情侶失蹤洋只,失蹤者是張志新(化名)和其女友劉穎辆沦,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體识虚,經(jīng)...
    沈念sama閱讀 45,367評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡肢扯,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,581評論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了担锤。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蔚晨。...
    茶點(diǎn)故事閱讀 39,754評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖肛循,靈堂內(nèi)的尸體忽然破棺而出铭腕,到底是詐尸還是另有隱情,我是刑警寧澤多糠,帶...
    沈念sama閱讀 35,458評論 5 344
  • 正文 年R本政府宣布累舷,位于F島的核電站,受9級特大地震影響夹孔,放射性物質(zhì)發(fā)生泄漏被盈。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,068評論 3 327
  • 文/蒙蒙 一搭伤、第九天 我趴在偏房一處隱蔽的房頂上張望只怎。 院中可真熱鬧,春花似錦怜俐、人聲如沸身堡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,692評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽贴谎。三九已至,卻和暖如春季稳,著一層夾襖步出監(jiān)牢的瞬間赴精,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,842評論 1 269
  • 我被黑心中介騙來泰國打工绞幌, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人一忱。 一個月前我還...
    沈念sama閱讀 47,797評論 2 369
  • 正文 我出身青樓莲蜘,卻偏偏與公主長得像谭确,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子票渠,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,654評論 2 354