2016-05-24~28:資料+推薦

  1. Scikit Flow介紹和源碼分析

  2. EM算法原理和應用

  3. 商品搜索引擎---推薦系統(tǒng)設計

  4. 模式識別筆記

  5. 博客-論文贞盯,caffe

  6. 語義分析方法


推薦系統(tǒng)讀書筆記

協(xié)同過濾推薦

1. 基于用戶的最近鄰推薦

輸入:用戶-物品的評分矩陣鳄袍,待預測用戶
思路:

  • 找到與目標用戶過去有相似偏好的用戶組,作為近鄰用戶援雇。
  • 對每一個目標用戶沒有打分的物品裕循,利用鄰近用戶的打分做預測

前提假設:

  • 用戶過去偏好相似枷莉,這用戶將來偏好相似
  • 用戶偏好不隨時間改變

例子

Pearson方法計算用戶相似度
通過最近鄰用戶預測物品評分
小結
  • Pearson相關系數取值是-1~1的娇昙,1代表強正相關,-1代表強負相關依沮。
  • Pearson考慮了不同用戶不同的評分范圍涯贞,因為每次計算的都是與平均數的差值枪狂。
  • 沒有考慮到,用戶間對于冷門物品的共同偏好宋渔,相比于熱門物品來說州疾,價值更大,但是目前沒有考慮到
  • 還有其他衡量用戶相似度的方法:改進余弦相似度皇拣,Spearman秩相關系數严蓖,均方差
  • 近鄰用戶選擇,上文為方便說明只選了1個氧急,可以選擇K個最近鄰颗胡,實踐中20~50的效果不錯

2. 基于物品的最近鄰推薦

輸入:用戶-物品的評分矩陣,待預測用戶
思路:

  • 找到目標用戶對于待預測物品的相似物品的評分吩坝。
  • 根據相似物品的評分按照權重計算得到的平均值進行計算
余弦夾角計算相似度
改進的余弦夾角

協(xié)同過濾的其它話題

  1. 評分
  • 顯式評分需要用戶額外付出毒姨,用戶會因為得不到任何好處而放棄評價,因此需要收集隱式評分钉寝,例如買了一個商品弧呐,在某商品詳情頁停留很久,都可以作為正向意圖
  • 推薦系統(tǒng)冷啟動嵌纲,可以利用用戶附加信息對用戶進行分類俘枫,例如年齡,性別逮走,教育程度等鸠蚪。
  • 數據稀疏問題,利用假設用戶偏向有傳遞性师溅,由此增強額外信息矩陣茅信。例如User1 -> Item1 -> User2 -> Item2推薦路徑長度是3,可以拓展為5或其他更長情況
  1. 基于模型的推薦
  • 推薦系統(tǒng)使用矩陣因子分解的方法墓臭,從評分模式中抽取一組潛在的因子汹押,通過這些因子向量來描述用戶和物品
  • SVD將高度相關且一起出現(xiàn)的詞語作為單獨因子,把大的矩陣向量差分成更小階的近似矩陣
  • PCA主成分分析對評分數據預處理起便,過濾出數據中最重要的方面來解釋大多數變量,經過PCA處理后的數據窖维,原始評分數據被投射到最相關的主特征向量上
  1. 關聯(lián)規(guī)則挖掘
  • 關聯(lián)規(guī)則應用到推薦就是自動發(fā)現(xiàn)規(guī)則榆综。
  • 關聯(lián)規(guī)則的衡量標準是支持度和可信度
  • 所有的正向評分都記做一次購買行為
  • 得到的規(guī)則是:喜歡物品1的同時喜歡物品5
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市铸史,隨后出現(xiàn)的幾起案子鼻疮,更是在濱河造成了極大的恐慌,老刑警劉巖琳轿,帶你破解...
    沈念sama閱讀 211,639評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件判沟,死亡現(xiàn)場離奇詭異耿芹,居然都是意外死亡,警方通過查閱死者的電腦和手機挪哄,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,277評論 3 385
  • 文/潘曉璐 我一進店門吧秕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人迹炼,你說我怎么就攤上這事砸彬。” “怎么了斯入?”我有些...
    開封第一講書人閱讀 157,221評論 0 348
  • 文/不壞的土叔 我叫張陵砂碉,是天一觀的道長。 經常有香客問我刻两,道長增蹭,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,474評論 1 283
  • 正文 為了忘掉前任磅摹,我火速辦了婚禮滋迈,結果婚禮上,老公的妹妹穿的比我還像新娘偏瓤。我一直安慰自己杀怠,他們只是感情好,可當我...
    茶點故事閱讀 65,570評論 6 386
  • 文/花漫 我一把揭開白布厅克。 她就那樣靜靜地躺著赔退,像睡著了一般。 火紅的嫁衣襯著肌膚如雪证舟。 梳的紋絲不亂的頭發(fā)上硕旗,一...
    開封第一講書人閱讀 49,816評論 1 290
  • 那天,我揣著相機與錄音女责,去河邊找鬼漆枚。 笑死,一個胖子當著我的面吹牛抵知,可吹牛的內容都是我干的墙基。 我是一名探鬼主播,決...
    沈念sama閱讀 38,957評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼刷喜,長吁一口氣:“原來是場噩夢啊……” “哼残制!你這毒婦竟也來了?” 一聲冷哼從身側響起掖疮,我...
    開封第一講書人閱讀 37,718評論 0 266
  • 序言:老撾萬榮一對情侶失蹤初茶,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后浊闪,有當地人在樹林里發(fā)現(xiàn)了一具尸體恼布,經...
    沈念sama閱讀 44,176評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡螺戳,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,511評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了折汞。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片倔幼。...
    茶點故事閱讀 38,646評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖字支,靈堂內的尸體忽然破棺而出凤藏,到底是詐尸還是另有隱情,我是刑警寧澤堕伪,帶...
    沈念sama閱讀 34,322評論 4 330
  • 正文 年R本政府宣布揖庄,位于F島的核電站,受9級特大地震影響欠雌,放射性物質發(fā)生泄漏蹄梢。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,934評論 3 313
  • 文/蒙蒙 一富俄、第九天 我趴在偏房一處隱蔽的房頂上張望禁炒。 院中可真熱鬧,春花似錦霍比、人聲如沸幕袱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,755評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽们豌。三九已至,卻和暖如春浅妆,著一層夾襖步出監(jiān)牢的瞬間望迎,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,987評論 1 266
  • 我被黑心中介騙來泰國打工凌外, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留辩尊,地道東北人。 一個月前我還...
    沈念sama閱讀 46,358評論 2 360
  • 正文 我出身青樓康辑,卻偏偏與公主長得像摄欲,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子疮薇,可洞房花燭夜當晚...
    茶點故事閱讀 43,514評論 2 348

推薦閱讀更多精彩內容

  • 基于模型的協(xié)同過濾算法 基于模型的協(xié)同過濾算法是源自于推薦過程可以被視為分類或預測問題的這一思想蒿涎,它將評分矩陣作為...
    T_129e閱讀 1,075評論 0 0
  • 1.基于內容的推薦系統(tǒng): 推薦系統(tǒng)以個性化的方式指引用戶在眾多選擇中找到感興趣的東西〉胄粒基于內容的推薦系統(tǒng)會發(fā)掘用戶...
    T_129e閱讀 448評論 0 1
  • 1 推薦系統(tǒng)基礎## 1.1 個性化推薦概述### 1.1.1 推薦系統(tǒng)概述 首先,需要申明一點的就是推薦系統(tǒng)仓手!=...
    城市中迷途小書童閱讀 1,366評論 1 23
  • 個性化推薦系統(tǒng)可以理解成一個“為目標用戶找到目標物品”的系統(tǒng)胖齐,整個過程大致可以分為幾個步驟玻淑,確定目標用戶-召回目標...
    蕭飯飯閱讀 3,478評論 1 15
  • 原來愛一個人补履,真的會變得很盲目吧。 我們都曾盲目的愛過一個人吧剿另,不計后果箫锤,也不在乎有沒有人支持,把未來都壓在了那個...
    毛毛笨蛋閱讀 258評論 0 4