5分鐘帶你了解個(gè)性化推薦系統(tǒng)

什么是推薦系統(tǒng)

推薦系統(tǒng)是用來(lái)聯(lián)系用戶和信息缀皱,解決信息過(guò)載,挖掘長(zhǎng)尾信息的一種系統(tǒng)绑咱。

如何評(píng)價(jià)一個(gè)推薦系統(tǒng)

通常來(lái)說(shuō)評(píng)價(jià)一個(gè)推薦系統(tǒng)好壞是通過(guò)以下指標(biāo)來(lái)進(jìn)行的:
準(zhǔn)確度
召回率
覆蓋率
新穎性
多樣性
健壯性
信任度
實(shí)時(shí)性

推薦系統(tǒng)的常用架構(gòu)

聯(lián)系用戶和物品的推薦系統(tǒng)

所以對(duì)這三種推薦系統(tǒng)做一下抽象的話,推薦系統(tǒng)本質(zhì)上都是一個(gè)用戶—特征—物品的系統(tǒng),所以推薦系統(tǒng)的任務(wù)只拆解成了兩部分瓤介。一個(gè)是如何給用戶生成特征,一個(gè)是如何根據(jù)特征找到物品赘那。

推薦系統(tǒng)的常用方法

推薦系統(tǒng)有非常多的方法刑桑,比較基礎(chǔ)比較通用的是以下幾種:

1.基于內(nèi)容的推薦
2.基于物品的協(xié)同過(guò)濾推薦
3.基于用戶的協(xié)同過(guò)濾推薦
4.基于標(biāo)簽的推薦

1.基于內(nèi)容的推薦:

基于內(nèi)容的推薦是比較基礎(chǔ)的一種推薦策略。如果你瀏覽或購(gòu)買過(guò)某種類型的內(nèi)容募舟,則給你推薦這種類型下的其他內(nèi)容祠斧。如果內(nèi)容是文本信息類,就需要先通過(guò)自然語(yǔ)言技術(shù)抽取關(guān)鍵詞拱礁,建立關(guān)鍵詞向量琢锋。
計(jì)算內(nèi)容相似度的方法:
將關(guān)鍵詞計(jì)算空間向量模型,量化物品內(nèi)容的相似度觅彰。

基于內(nèi)容推薦的優(yōu)點(diǎn):
新穎性較高吩蔑,當(dāng)用戶的行為強(qiáng)烈受某一內(nèi)容屬性影響時(shí),內(nèi)容過(guò)濾算法精度上可超過(guò)協(xié)同過(guò)濾算法
基于內(nèi)容推薦的缺點(diǎn):
內(nèi)容過(guò)濾算法 忽視了用戶行為填抬,物品流行度及用戶行為中包含的規(guī)律,精度比較低隧期。

2.基于物品的協(xié)同過(guò)濾推薦

基于物品的協(xié)同過(guò)濾與傳統(tǒng)的基于內(nèi)容過(guò)濾直接分析內(nèi)容進(jìn)行推薦不同飒责,協(xié)同過(guò)濾會(huì)分析系統(tǒng)已有數(shù)據(jù)赘娄,并結(jié)合用戶表現(xiàn)的數(shù)據(jù),對(duì)該指定用戶對(duì)此信息的喜好程度預(yù)測(cè)宏蛉。
計(jì)算基于物品的協(xié)同過(guò)濾推薦的方法

公式

這里N(u)表示用戶有關(guān)聯(lián)的商品的集合遣臼,Wji表示物品j和i的相似度,Rui表示用戶u對(duì)物品i的打分拾并。打分規(guī)則,往往由業(yè)務(wù)來(lái)確定即可,物品相似度規(guī)則往往是使用“對(duì)物品j發(fā)生正向反饋的用戶和對(duì)物品i 發(fā)生正向反饋的用戶交集除以對(duì)物品i發(fā)生正向反饋的用戶”贮聂,但這里通常還需要對(duì)熱門物品降權(quán)揭北,活躍用戶降權(quán)等等。

3.基于用戶的協(xié)同過(guò)濾推薦

基于用戶的協(xié)同過(guò)濾之碗,通過(guò)用戶對(duì)不同內(nèi)容的行為蝙眶,來(lái)評(píng)測(cè)用戶之間的相似性,基于用戶之間的相似性做出推薦褪那。這部分推薦本質(zhì)上是給相似的用戶推薦其他用戶喜歡的內(nèi)容幽纷。

計(jì)算基于用戶的協(xié)同過(guò)濾推薦的方法

公式

這里N(i)表示對(duì)物品i有過(guò)行為的用戶集合,Wuv使用用戶u和用戶v的相似度博敬,Rvi表示用戶v對(duì)物品i的打分友浸。同理,打分規(guī)則由業(yè)務(wù)來(lái)確定即可偏窝,計(jì)算用戶之間的相似度可以使用“用戶u發(fā)生正反饋的物品與用戶v發(fā)生正反饋的物品交集除以兩者的并集”尾菇,同樣需要考慮對(duì)熱門物品,活躍用戶降權(quán)的問(wèn)題囚枪。

4.基于標(biāo)簽的推薦

基于標(biāo)簽的推薦派诬,主要是通過(guò)標(biāo)簽這種特征形式去聯(lián)系用戶和物品,給用戶推薦那些具有用戶喜歡的特征的物品链沼。所以計(jì)算標(biāo)簽推薦的方法是建立用戶和標(biāo)簽之間的關(guān)聯(lián)度默赂,再計(jì)算標(biāo)簽與物品之間的關(guān)聯(lián)度,兩者相乘即為用戶對(duì)某物品的感興趣程度括勺。

關(guān)于物品和用戶的協(xié)同過(guò)濾對(duì)比

性能
userCF(基于用戶的協(xié)同過(guò)濾) 適用于用戶較少的場(chǎng)景缆八,否則計(jì)算用戶相似度矩陣代價(jià)很大
itemCF(基于物品的協(xié)同過(guò)濾) 物品數(shù)明顯小于用戶數(shù)的場(chǎng)合,否則物品相似度矩陣代價(jià)很大

領(lǐng)域
userCF 時(shí)效性較強(qiáng)疾捍,適用于用戶個(gè)性化興趣沒(méi)有那么明顯的領(lǐng)域奈辰。
itemCF 適合長(zhǎng)尾物品豐富,用戶個(gè)性化需求更強(qiáng)烈的領(lǐng)域

實(shí)時(shí)性
userCF用戶有新行為乱豆,不一定使推薦結(jié)果立即變化
itemCF用戶有新行為奖恰,一定會(huì)導(dǎo)致推薦結(jié)果的實(shí)時(shí)變化

冷啟動(dòng)
新物品上線:
userCF新物品上線后,只要有用戶對(duì)其產(chǎn)生了行為,那該新物品就能夠推薦給相似的用戶
itemCF 不更新物品相似度表的情況下無(wú)法將新物品推薦給用戶
新用戶上線:
userCF 新用戶一開(kāi)始對(duì)物品產(chǎn)生行為瑟啃,無(wú)法對(duì)其進(jìn)行推薦
itemCF 新用戶對(duì)物品產(chǎn)生行為论泛,就能推薦跟該物品相似的其他物品給用戶

寫在最后

推薦系統(tǒng)的大概知識(shí)就介紹到這里了,還有一些基于時(shí)間上下文的協(xié)同過(guò)濾推薦蛹屿,隱語(yǔ)義模型屁奏,基于社交網(wǎng)絡(luò)的推薦等等就沒(méi)再介紹。推薦系統(tǒng)是一個(gè)典型的知易行難的領(lǐng)域错负,不同的公司不同的業(yè)務(wù)在實(shí)際應(yīng)用中會(huì)有各種各樣的坑坟瓢,這些坑不會(huì)寫在書/論文里,通用的方法不經(jīng)打磨很難在實(shí)際場(chǎng)景中應(yīng)用犹撒,而建立個(gè)性化推薦系統(tǒng)也未必比部分的人工規(guī)則有多大的優(yōu)勢(shì)折联。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市油航,隨后出現(xiàn)的幾起案子崭庸,更是在濱河造成了極大的恐慌,老刑警劉巖谊囚,帶你破解...
    沈念sama閱讀 212,454評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件怕享,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡镰踏,警方通過(guò)查閱死者的電腦和手機(jī)函筋,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)奠伪,“玉大人跌帐,你說(shuō)我怎么就攤上這事“砺剩” “怎么了谨敛?”我有些...
    開(kāi)封第一講書人閱讀 157,921評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)滤否。 經(jīng)常有香客問(wèn)我脸狸,道長(zhǎng),這世上最難降的妖魔是什么藐俺? 我笑而不...
    開(kāi)封第一講書人閱讀 56,648評(píng)論 1 284
  • 正文 為了忘掉前任炊甲,我火速辦了婚禮,結(jié)果婚禮上欲芹,老公的妹妹穿的比我還像新娘卿啡。我一直安慰自己,他們只是感情好菱父,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,770評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布颈娜。 她就那樣靜靜地躺著剑逃,像睡著了一般。 火紅的嫁衣襯著肌膚如雪揭鳞。 梳的紋絲不亂的頭發(fā)上炕贵,一...
    開(kāi)封第一講書人閱讀 49,950評(píng)論 1 291
  • 那天梆奈,我揣著相機(jī)與錄音野崇,去河邊找鬼。 笑死亩钟,一個(gè)胖子當(dāng)著我的面吹牛乓梨,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播清酥,決...
    沈念sama閱讀 39,090評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼扶镀,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了焰轻?” 一聲冷哼從身側(cè)響起臭觉,我...
    開(kāi)封第一講書人閱讀 37,817評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎辱志,沒(méi)想到半個(gè)月后蝠筑,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,275評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡揩懒,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,592評(píng)論 2 327
  • 正文 我和宋清朗相戀三年什乙,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片已球。...
    茶點(diǎn)故事閱讀 38,724評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡臣镣,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出智亮,到底是詐尸還是另有隱情忆某,我是刑警寧澤,帶...
    沈念sama閱讀 34,409評(píng)論 4 333
  • 正文 年R本政府宣布阔蛉,位于F島的核電站弃舒,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏馍忽。R本人自食惡果不足惜棒坏,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,052評(píng)論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望遭笋。 院中可真熱鬧坝冕,春花似錦、人聲如沸瓦呼。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,815評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至磨澡,卻和暖如春碗啄,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背稳摄。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,043評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工稚字, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人厦酬。 一個(gè)月前我還...
    沈念sama閱讀 46,503評(píng)論 2 361
  • 正文 我出身青樓胆描,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親仗阅。 傳聞我的和親對(duì)象是個(gè)殘疾皇子昌讲,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,627評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容