推薦系統(tǒng)讀書筆記
協(xié)同過濾推薦
1. 基于用戶的最近鄰推薦
輸入:用戶-物品的評分矩陣鳄袍,待預測用戶
思路:
- 找到與目標用戶過去有相似偏好的用戶組,作為近鄰用戶援雇。
- 對每一個目標用戶沒有打分的物品裕循,利用鄰近用戶的打分做預測
前提假設:
- 用戶過去偏好相似枷莉,這用戶將來偏好相似
- 用戶偏好不隨時間改變
例子
小結
- Pearson相關系數取值是-1~1的娇昙,1代表強正相關,-1代表強負相關依沮。
- Pearson考慮了不同用戶不同的評分范圍涯贞,因為每次計算的都是與平均數的差值枪狂。
- 沒有考慮到,用戶間對于冷門物品的共同偏好宋渔,相比于熱門物品來說州疾,價值更大,但是目前沒有考慮到
- 還有其他衡量用戶相似度的方法:改進余弦相似度皇拣,Spearman秩相關系數严蓖,均方差
- 近鄰用戶選擇,上文為方便說明只選了1個氧急,可以選擇K個最近鄰颗胡,實踐中20~50的效果不錯
2. 基于物品的最近鄰推薦
輸入:用戶-物品的評分矩陣,待預測用戶
思路:
- 找到目標用戶對于待預測物品的相似物品的評分吩坝。
- 根據相似物品的評分按照權重計算得到的平均值進行計算
協(xié)同過濾的其它話題
- 評分
- 顯式評分需要用戶額外付出毒姨,用戶會因為得不到任何好處而放棄評價,因此需要收集隱式評分钉寝,例如買了一個商品弧呐,在某商品詳情頁停留很久,都可以作為正向意圖
- 推薦系統(tǒng)冷啟動嵌纲,可以利用用戶附加信息對用戶進行分類俘枫,例如年齡,性別逮走,教育程度等鸠蚪。
- 數據稀疏問題,利用假設用戶偏向有傳遞性师溅,由此增強額外信息矩陣茅信。例如User1 -> Item1 -> User2 -> Item2推薦路徑長度是3,可以拓展為5或其他更長情況
- 基于模型的推薦
- 推薦系統(tǒng)使用矩陣因子分解的方法墓臭,從評分模式中抽取一組潛在的因子汹押,通過這些因子向量來描述用戶和物品
- SVD將高度相關且一起出現(xiàn)的詞語作為單獨因子,把大的矩陣向量差分成更小階的近似矩陣
- PCA主成分分析對評分數據預處理起便,過濾出數據中最重要的方面來解釋大多數變量,經過PCA處理后的數據窖维,原始評分數據被投射到最相關的主特征向量上
- 關聯(lián)規(guī)則挖掘
- 關聯(lián)規(guī)則應用到推薦就是自動發(fā)現(xiàn)規(guī)則榆综。
- 關聯(lián)規(guī)則的衡量標準是支持度和可信度
- 所有的正向評分都記做一次購買行為
- 得到的規(guī)則是:喜歡物品1的同時喜歡物品5