User-Based Collaborative Filtering


基于用戶的協(xié)同過濾算法是最古老的一種推薦算法桐玻。早在1992年篙挽,施樂公司的PARC實(shí)驗(yàn)室(IT史上最具影響力的實(shí)驗(yàn)室之一)設(shè)計(jì)了Tapestry系統(tǒng)來進(jìn)行郵件過濾,這也是協(xié)同過濾算法最早的應(yīng)用镊靴;1994年的GroupLens項(xiàng)目是推薦系統(tǒng)的又一個(gè)里程碑铣卡,在該項(xiàng)目中使用了基于用戶的協(xié)同過濾算法來進(jìn)行新聞推薦链韭。

基本算法

UserCF是一種基于用戶歷史行為的推薦算法,它的基本思想如下:為了給用戶A推薦物品煮落,系統(tǒng)會參考K個(gè)與用戶A興趣相近的用戶所喜好的物品敞峭。如果其中有用戶A尚未關(guān)注的物品,就很有可能是用戶A感興趣的蝉仇,系統(tǒng)就可以將這些物品推薦給用戶A旋讹。具體的說,基于協(xié)同過濾的系統(tǒng)轿衔,通常具有以下幾個(gè)特點(diǎn):

  • 如何收集用戶喜好
  • 如何評價(jià)用戶間的相似程度
  • 如何為目標(biāo)用戶進(jìn)行推薦

用戶喜好收集

首先沉迹,系統(tǒng)可以收集用戶對物品的喜好程度。由于協(xié)同過濾算法的輸入是一個(gè)user-item的rating矩陣害驹,所以我們需要在實(shí)際問題中提煉出用戶對物品喜好程度(rating)的數(shù)值表示鞭呕。對于不同的系統(tǒng),有一些不同的實(shí)現(xiàn)

  • 評分宛官,顯性評分琅拌,可以歸一化后直接使用
  • 投票,顯性評分摘刑,贊作為正評分进宝,踩作為負(fù)評分
  • 轉(zhuǎn)發(fā),隱性評分枷恕,按布爾型處理党晋,轉(zhuǎn)發(fā)在一定程度上表現(xiàn)了對物品的喜好
  • 收藏,隱性評分徐块,按布爾型處理未玻,收藏在一定程度上表現(xiàn)了對物品的喜好
  • 回復(fù)/評論,隱性評分胡控,對回復(fù)和評論的文本內(nèi)容進(jìn)行情感分析可以得到用戶對物品的喜好程度
  • 點(diǎn)擊扳剿,隱性評分,用戶的點(diǎn)擊一定程度上反映了物品是否引起了用戶的注意昼激,所以也可以反映用戶的喜好
  • 頁面停留時(shí)間庇绽,隱性評分,用戶提留時(shí)間長橙困,說明物品是否引起了用戶的注意瞧掺,缺點(diǎn)是噪音較大
  • 購買,隱性評分凡傅,購買物品是用戶喜好的一個(gè)很強(qiáng)的表示

除此之外辟狈,不同的系統(tǒng)還可以根據(jù)自身特點(diǎn)采用不用的用戶行為。如音樂推薦系統(tǒng)中的”完整收聽”,微博用戶推薦系統(tǒng)中的“關(guān)注”等等哼转。
在一個(gè)實(shí)際的系統(tǒng)中明未,用戶的行為往往不是單一的,比如在微博推薦系統(tǒng)中壹蔓,用戶對微博的操作包括點(diǎn)擊瀏覽亚隅、收藏、轉(zhuǎn)發(fā)庶溶、評論等等煮纵。如何組合不同的用戶行為,通常有兩種做法:

  1. 將不同的行為分組:一般可以分為“查看”和“購買”等等偏螺,然后基于不同的行為行疏,計(jì)算不同的用戶 / 物品相似度。類似于當(dāng)當(dāng)網(wǎng)或者 Amazon 給出的“購買了該圖書的人還購買了 ...”套像,“查看了圖書的人還查看了 ...”
  2. 根據(jù)不同行為反映用戶喜好的程度將它們進(jìn)行加權(quán)酿联,得到用戶對于物品的總體喜好。一般來說夺巩,顯式的用戶反饋比隱式的權(quán)值大贞让,但比較稀疏;同時(shí)相對于“查看”柳譬,“購買”行為反映用戶喜好的程度更大喳张,但這也因應(yīng)用而異。

Reference

[1]: [Coursera課程:推薦系統(tǒng)導(dǎo)論][1]
[2]: [探索推薦引擎內(nèi)部的秘密美澳,第 2 部分: 深入推薦引擎相關(guān)算法 - 協(xié)同過濾][2]
[3]: 推薦系統(tǒng)實(shí)踐
[4]: Recommender Systems:An Introduction
[5]: Herlocker, Jonathan L., et al. "An algorithmic framework for performing collaborative filtering." SIGIR09. ACM, 1999.
[1]:https://www.coursera.org/learn/recommender-systems/home
[2]:https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末销部,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子制跟,更是在濱河造成了極大的恐慌舅桩,老刑警劉巖,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件雨膨,死亡現(xiàn)場離奇詭異擂涛,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)聊记,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進(jìn)店門撒妈,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人甥雕,你說我怎么就攤上這事踩身≌鸵穑” “怎么了社露?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長琼娘。 經(jīng)常有香客問我峭弟,道長附鸽,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任瞒瘸,我火速辦了婚禮坷备,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘情臭。我一直安慰自己省撑,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布俯在。 她就那樣靜靜地躺著竟秫,像睡著了一般。 火紅的嫁衣襯著肌膚如雪跷乐。 梳的紋絲不亂的頭發(fā)上肥败,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天,我揣著相機(jī)與錄音愕提,去河邊找鬼馒稍。 笑死,一個(gè)胖子當(dāng)著我的面吹牛浅侨,可吹牛的內(nèi)容都是我干的纽谒。 我是一名探鬼主播,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼如输,長吁一口氣:“原來是場噩夢啊……” “哼佛舱!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起挨决,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤请祖,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后脖祈,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體肆捕,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年盖高,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了慎陵。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,161評論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡喻奥,死狀恐怖席纽,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情撞蚕,我是刑警寧澤润梯,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響纺铭,放射性物質(zhì)發(fā)生泄漏寇钉。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一舶赔、第九天 我趴在偏房一處隱蔽的房頂上張望扫倡。 院中可真熱鬧,春花似錦竟纳、人聲如沸撵溃。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽征懈。三九已至,卻和暖如春揩悄,著一層夾襖步出監(jiān)牢的瞬間卖哎,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工删性, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留亏娜,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓蹬挺,卻偏偏與公主長得像维贺,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子巴帮,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容