推薦系統(tǒng)中的比較流行的算法

在推薦系統(tǒng)簡介中汪茧,我們給出了推薦系統(tǒng)的一般框架椅亚。很明顯,推薦方法是整個推薦系統(tǒng)中最核心舱污、最關(guān)鍵的部分呀舔,很大程度上決定了推薦系統(tǒng)性能的優(yōu)劣。目前扩灯,主要的推薦方法包括:基于內(nèi)容推薦媚赖、協(xié)同過濾推薦、基于關(guān)聯(lián)規(guī)則推薦珠插、基于效用推薦惧磺、基于知識推薦和組合推薦。

一捻撑、基于內(nèi)容推薦

基 于內(nèi)容的推薦(Content-based Recommendation)是信息過濾技術(shù)的延續(xù)與發(fā)展磨隘,它是建立在項目的內(nèi)容信息上作出推薦的缤底,而不需要依據(jù)用戶對項目的評價意見,更多地需要用機 器學(xué)習(xí)的方法從關(guān)于內(nèi)容的特征描述的事例中得到用戶的興趣資料番捂。在基于內(nèi)容的推薦系統(tǒng)中个唧,項目或?qū)ο笫峭ㄟ^相關(guān)的特征的屬性來定義,系統(tǒng)基于用戶評價對象 的特征设预,學(xué)習(xí)用戶的興趣徙歼,考察用戶資料與待預(yù)測項目的相匹配程度。用戶的資料模型取決于所用學(xué)習(xí)方法鳖枕,常用的有決策樹鲁沥、神經(jīng)網(wǎng)絡(luò)和基于向量的表示方法等。 基于內(nèi)容的用戶資料是需要有用戶的歷史數(shù)據(jù)耕魄,用戶資料模型可能隨著用戶的偏好改變而發(fā)生變化画恰。

基于內(nèi)容推薦方法的優(yōu)點是:

? 1)不需要其它用戶的數(shù)據(jù),沒有冷開始問題和稀疏問題吸奴。

? 2)能為具有特殊興趣愛好的用戶進行推薦允扇。

? 3)能推薦新的或不是很流行的項目,沒有新項目問題则奥。

? 4)通過列出推薦項目的內(nèi)容特征考润,可以解釋為什么推薦那些項目。

? 5)已有比較好的技術(shù)读处,如關(guān)于分類學(xué)習(xí)方面的技術(shù)已相當成熟糊治。

缺點是要求內(nèi)容能容易抽取成有意義的特征,要求特征內(nèi)容有良好的結(jié)構(gòu)性罚舱,并且用戶的口味必須能夠用內(nèi)容特征形式來表達井辜,不能顯式地得到其它用戶的判斷情況。

二管闷、協(xié)同過濾推薦

協(xié) 同過濾推薦(Collaborative Filtering Recommendation)技術(shù)是推薦系統(tǒng)中應(yīng)用最早和最為成功的技術(shù)之一粥脚。它一般采用最近鄰技術(shù),利用用戶的歷史喜好信息計算用戶之間的距離包个,然后 利用目標用戶的最近鄰居用戶對商品評價的加權(quán)評價值來預(yù)測目標用戶對特定商品的喜好程度刷允,系統(tǒng)從而根據(jù)這一喜好程度來對目標用戶進行推薦。協(xié)同過濾最大優(yōu) 點是對推薦對象沒有特殊的要求碧囊,能處理非結(jié)構(gòu)化的復(fù)雜對象树灶,如音樂、電影糯而。

協(xié) 同過濾是基于這樣的假設(shè):為一用戶找到他真正感興趣的內(nèi)容的好方法是首先找到與此用戶有相似興趣的其他用戶天通,然后將他們感興趣的內(nèi)容推薦給此用戶。其基本 思想非常易于理解歧蒋,在日常生活中土砂,我們往往會利用好朋友的推薦來進行一些選擇。協(xié)同過濾正是把這一思想運用到電子商務(wù)推薦系統(tǒng)中來谜洽,基于其他用戶對某一內(nèi) 容的評價來向目標用戶進行推薦萝映。

基于協(xié)同過濾的推薦系統(tǒng)可以說是從用戶的角度來進行相應(yīng)推薦的,而且是自動的阐虚,即用戶獲得的推薦是系統(tǒng)從購買模式或瀏覽行為等隱式獲得的序臂,不需要用戶努力地找到適合自己興趣的推薦信息,如填寫一些調(diào)查表格等实束。

和基于內(nèi)容的過濾方法相比奥秆,協(xié)同過濾具有如下的優(yōu)點:

1) 能夠過濾難以進行機器自動內(nèi)容分析的信息,如藝術(shù)品咸灿,音樂等构订。

2) 共享其他人的經(jīng)驗,避免了內(nèi)容分析的不完全和不精確避矢,并且能夠基于一些復(fù)雜的悼瘾,難以表述的概念(如信息質(zhì)量、個人品味)進行過濾审胸。

3) 有推薦新信息的能力亥宿。可以發(fā)現(xiàn)內(nèi)容上完全不相似的信息砂沛,用戶對推薦信息的內(nèi)容事先是預(yù)料不到的烫扼。這也是協(xié)同過濾和基于內(nèi)容的過濾一個較大的差別,基于內(nèi)容的過濾推薦很多都是用戶本來就熟悉的內(nèi)容碍庵,而協(xié)同過濾可以發(fā)現(xiàn)用戶潛在的但自己尚未發(fā)現(xiàn)的興趣偏好映企。

4) 能夠有效的使用其他相似用戶的反饋信息,較少用戶的反饋量静浴,加快個性化學(xué)習(xí)的速度卑吭。

雖然協(xié)同過濾作為一種典型的推薦技術(shù)有其相當?shù)膽?yīng)用,但協(xié)同過濾仍有許多的問題需要解決马绝。最典型的問題有稀疏問題(Sparsity)和可擴展問題(Scalability)豆赏。

三、基于關(guān)聯(lián)規(guī)則推薦

基 于關(guān)聯(lián)規(guī)則的推薦(Association Rule-based Recommendation)是以關(guān)聯(lián)規(guī)則為基礎(chǔ)富稻,把已購商品作為規(guī)則頭掷邦,規(guī)則體為推薦對象。關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)不同商品在銷售過程中的相關(guān)性椭赋,在零 售業(yè)中已經(jīng)得到了成功的應(yīng)用抚岗。管理規(guī)則就是在一個交易數(shù)據(jù)庫中統(tǒng)計購買了商品集X的交易中有多大比例的交易同時購買了商品集Y,其直觀的意義就是用戶在購 買某些商品的時候有多大傾向去購買另外一些商品哪怔。比如購買牛奶的同時很多人會同時購買面包宣蔚。

算法的第一步關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)最為關(guān)鍵且最耗時向抢,是算法的瓶頸,但可以離線進行胚委。其次挟鸠,商品名稱的同義性問題也是關(guān)聯(lián)規(guī)則的一個難點。

四亩冬、基于效用推薦

基 于效用的推薦(Utility-based Recommendation)是建立在對用戶使用項目的效用情況上計算的艘希,其核心問題是怎么樣為每一個用戶去創(chuàng)建一個效用函數(shù),因此硅急,用戶資料模型很大 程度上是由系統(tǒng)所采用的效用函數(shù)決定的覆享。基于效用推薦的好處是它能把非產(chǎn)品的屬性营袜,如提供商的可靠性(Vendor Reliability)和產(chǎn)品的可得性(Product Availability)等考慮到效用計算中撒顿。

五、基于知識推薦

基 于知識的推薦(Knowledge-based Recommendation)在某種程度是可以看成是一種推理(Inference)技術(shù)荚板,它不是建立在用戶需要和偏好基礎(chǔ)上推薦的核蘸。基于知識的方法因 它們所用的功能知識不同而有明顯區(qū)別啸驯。效用知識(Functional Knowledge)是一種關(guān)于一個項目如何滿足某一特定用戶的知識客扎,因此能解釋需要和推薦的關(guān)系,所以用戶資料可以是任何能支持推理的知識結(jié)構(gòu)罚斗,它可以 是用戶已經(jīng)規(guī)范化的查詢徙鱼,也可以是一個更詳細的用戶需要的表示。

六针姿、組合推薦

由 于各種推薦方法都有優(yōu)缺點袱吆,所以在實際中,組合推薦(Hybrid Recommendation)經(jīng)常被采用距淫。研究和應(yīng)用最多的是內(nèi)容推薦和協(xié)同過濾推薦的組合绞绒。最簡單的做法就是分別用基于內(nèi)容的方法和協(xié)同過濾推薦方法 去產(chǎn)生一個推薦預(yù)測結(jié)果,然后用某方法組合其結(jié)果榕暇。盡管從理論上有很多種推薦組合方法蓬衡,但在某一具體問題中并不見得都有效,組合推薦一個最重要原則就是通 過組合后要能避免或彌補各自推薦技術(shù)的弱點彤枢。

在組合方式上狰晚,有研究人員提出了七種組合思路

1)加權(quán)(Weight):加權(quán)多種推薦技術(shù)結(jié)果。

2)變換(Switch):根據(jù)問題背景和實際情況或要求決定變換采用不同的推薦技術(shù)缴啡。

3)混合(Mixed):同時采用多種推薦技術(shù)給出多種推薦結(jié)果為用戶提供參考壁晒。

4)特征組合(Feature combination):組合來自不同推薦數(shù)據(jù)源的特征被另一種推薦算法所采用。

5)層疊(Cascade):先用一種推薦技術(shù)產(chǎn)生一種粗糙的推薦結(jié)果业栅,第二種推薦技術(shù)在此推薦結(jié)果的基礎(chǔ)上進一步作出更精確的推薦秒咐。

6)特征擴充(Feature augmentation):一種技術(shù)產(chǎn)生附加的特征信息嵌入到另一種推薦技術(shù)的特征輸入中谬晕。

7)元級別(Meta-level):用一種推薦方法產(chǎn)生的模型作為另一種推薦方法的輸入。

七携取、主要推薦方法的對比

各種推薦方法都有其各自的優(yōu)點和缺點攒钳,見表1。


作者:余平的余_余平的平

鏈接:http://www.reibang.com/p/956213992b5a

來源:簡書

簡書著作權(quán)歸作者所有歹茶,任何形式的轉(zhuǎn)載都請聯(lián)系作者獲得授權(quán)并注明出處。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末你弦,一起剝皮案震驚了整個濱河市惊豺,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌禽作,老刑警劉巖尸昧,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異旷偿,居然都是意外死亡烹俗,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進店門萍程,熙熙樓的掌柜王于貴愁眉苦臉地迎上來幢妄,“玉大人,你說我怎么就攤上這事茫负〗对В” “怎么了?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵忍法,是天一觀的道長潮尝。 經(jīng)常有香客問我,道長饿序,這世上最難降的妖魔是什么勉失? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮原探,結(jié)果婚禮上乱凿,老公的妹妹穿的比我還像新娘。我一直安慰自己咽弦,他們只是感情好告匠,可當我...
    茶點故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著离唬,像睡著了一般后专。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上输莺,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天戚哎,我揣著相機與錄音裸诽,去河邊找鬼。 笑死型凳,一個胖子當著我的面吹牛丈冬,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播甘畅,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼埂蕊,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了疏唾?” 一聲冷哼從身側(cè)響起蓄氧,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎槐脏,沒想到半個月后喉童,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡顿天,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年堂氯,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片牌废。...
    茶點故事閱讀 39,965評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡咽白,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出鸟缕,到底是詐尸還是另有隱情局扶,我是刑警寧澤,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布叁扫,位于F島的核電站三妈,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏莫绣。R本人自食惡果不足惜畴蒲,卻給世界環(huán)境...
    茶點故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望对室。 院中可真熱鬧模燥,春花似錦、人聲如沸掩宜。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽牺汤。三九已至辽旋,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背补胚。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工码耐, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人溶其。 一個月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓骚腥,卻偏偏與公主長得像,于是被迫代替她去往敵國和親瓶逃。 傳聞我的和親對象是個殘疾皇子束铭,可洞房花燭夜當晚...
    茶點故事閱讀 44,914評論 2 355

推薦閱讀更多精彩內(nèi)容