推薦系統(tǒng)

推薦系統(tǒng)就是用戶有一個需求中狂, 系統(tǒng)返回相關的item的系統(tǒng)。 推薦系統(tǒng)是非常重要的扑毡, 如在商場中吃型, 商家需要決定需要上市的商品, 一件商品如果是冷門了僚楞, 它占了貨架而沒帶來額外的利潤勤晚, 最終使商家損失。 在推薦系統(tǒng)中泉褐, 存在Long tail 的現(xiàn)象赐写, 即銷量好的東西集中在一個部分, 而其它的商品“銷量慘淡”膜赃。 因此挺邀, 對于線下銷售來說, 需要進行cut off跳座, 只上架熱銷的商品端铛。 在online的銷售中, 就不存在需要cut off的問題了疲眷, 因為我們的資源非常充足禾蚕。


long tail

總體而言, 推薦系統(tǒng)分為三類: Editorial and hand curated, 即手工推薦狂丝, 舉例: 書店的員工會把同類的書放在一起换淆, 這相當于一種推薦了; Simple aggregates 簡單的融合几颜, 如考慮這周的top 書單倍试, 然后推薦給用戶; Tailored to individual users 個性化推薦蛋哭, 這是最常見的县习, 考慮了用戶的興趣及行為, 可挖掘的信息也比較多。

簡單來說躁愿, 一個推薦系統(tǒng)就是對X與S之間算一個相似度評分哈蝇!那么首先就是收集信息了, 有了信息特征攘已, 才能計算衡量相似度炮赦。 若收集數(shù)據(jù)不夠充分, 還要考慮如何補充样勃, 這個時候我們更多的考慮highly unknown ratings吠勘。 一旦數(shù)據(jù)收集完成, 搭建好了一個系統(tǒng)峡眶, 那么如何評價推薦效果就是接下來及其重要的一步了剧防。接下來介紹的是Content-based的推薦系統(tǒng)。


model

下面是一個簡單的例子辫樱, 從用戶的profile得知他喜歡的item的profile并且從中提取特征峭拘, 然后進行推薦。


action

先講協(xié)同過濾

  • 協(xié)同過濾思想是比較簡單的狮暑, 給定x鸡挠, 找到與x相近的集合N, 然后從集合N中找到公共的元素搬男, 進行推薦拣展。 主要有兩種協(xié)同過濾: user-user and item-item。


    collaborative
  • 定義相似度缔逛。Jaccard只計算共同出現(xiàn)备埃, 而不考慮評分是否一致。 cosine similarity將missing value評為0. 用皮爾森相關系數(shù)是比較好的褐奴, 缺失值用均值代替按脚。 注意: 樣本減去均值, cosine就跟pearson等價了敦冬!


    similarity
  • 接下來就是做推薦了辅搬。一種是user-user, 另外一種是item-item。 user-user就是加權平均相近用戶的評分匪补, 得到user的評分伞辛。


    recommend
  • item-item的一種方法是跟user-user一樣烂翰。 根據(jù)item i的特征夯缺, 找出用戶x有評價的商品中跟item i評分接近的item。 然后根據(jù)item之間的相似度作為權重因子甘耿, 乘上用戶的評分踊兜。


    another
  • 例子。下面的例子是用item-item估計用戶5對movie 1的評分佳恬。 基本步驟就是用皮爾森相關系數(shù)衡量用戶5有評分的movie之間的相似度捏境, 然后進行加權平均于游, 這樣就得到了用戶的評分了。 以上是從行的觀點來看垫言; user-user是從列的觀點來看贰剥, 這種一種對偶的做法: 找到對movie 1 有評分的用戶中與用戶5接近的, 然后用其它用戶的評分加權平均作為用戶5的評分筷频。 可以看出來user-user受其它用戶的影響比較大蚌成, 而item-item利用的是用戶本身對其它商品的評價來得到評價, 在實際應用中這種做法是比較好的凛捏。


    example

    example
  • 協(xié)同過濾的好處是不用構建特征担忧, 但是存在如下的問題:需要足夠的用戶評分來構建系統(tǒng); 矩陣是稀疏的坯癣, 找到有評價的相鄰用戶是困難的瓶盛; 一個新來的item是無法進行評價的, 因為沒有用戶評分示罗; 趨于推薦popular item惩猫。


    pros/cons
  • 在實際中, 為了解決上述提到的問題蚜点, 引入全局統(tǒng)計信息帆锋, 評分的公式是用如下的公式的。 u是整個系統(tǒng)的用戶的評分的均值禽额, bx是用戶x對均值u的偏移量(也就是用戶對系統(tǒng)全部用戶評分的偏移)锯厢, bi是該item對均值u的偏移量。 最終對global 信息和協(xié)同過濾的評分相加作為最終的評分脯倒。


    practice
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末实辑,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子藻丢,更是在濱河造成了極大的恐慌剪撬,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件悠反,死亡現(xiàn)場離奇詭異残黑,居然都是意外死亡,警方通過查閱死者的電腦和手機斋否,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進店門梨水,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人茵臭,你說我怎么就攤上這事疫诽。” “怎么了?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵奇徒,是天一觀的道長雏亚。 經(jīng)常有香客問我,道長摩钙,這世上最難降的妖魔是什么罢低? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮胖笛,結果婚禮上奕短,老公的妹妹穿的比我還像新娘。我一直安慰自己匀钧,他們只是感情好翎碑,可當我...
    茶點故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著之斯,像睡著了一般日杈。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上佑刷,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天莉擒,我揣著相機與錄音,去河邊找鬼瘫絮。 笑死涨冀,一個胖子當著我的面吹牛,可吹牛的內容都是我干的麦萤。 我是一名探鬼主播鹿鳖,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼壮莹!你這毒婦竟也來了翅帜?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤命满,失蹤者是張志新(化名)和其女友劉穎涝滴,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體胶台,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡歼疮,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了诈唬。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片韩脏。...
    茶點故事閱讀 40,096評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖讯榕,靈堂內的尸體忽然破棺而出骤素,到底是詐尸還是另有隱情匙睹,我是刑警寧澤愚屁,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布济竹,位于F島的核電站,受9級特大地震影響霎槐,放射性物質發(fā)生泄漏送浊。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一丘跌、第九天 我趴在偏房一處隱蔽的房頂上張望袭景。 院中可真熱鬧,春花似錦闭树、人聲如沸耸棒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽与殃。三九已至,卻和暖如春碍现,著一層夾襖步出監(jiān)牢的瞬間幅疼,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工昼接, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留爽篷,地道東北人。 一個月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓慢睡,卻偏偏與公主長得像逐工,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子漂辐,可洞房花燭夜當晚...
    茶點故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內容