《推薦系統(tǒng)實踐》第八章學(xué)習(xí)筆記

??本章講的是評分預(yù)測問題轰枝,也就是如何通過已知的用戶歷史評分記錄預(yù)測未知的用戶評分記錄谎替。

評測算法

1. 平均值

??取平均值作為預(yù)測結(jié)果是最簡單有效的一種統(tǒng)計方法签舞,取平均值的方式有:全局平均值且预、用戶評分平均值收奔、物品評分平均值和用戶分類對物品分類的平均值(同類用戶對同類物品的評分平均值)荧飞。

2. 基于鄰域的方法

??基于用戶的鄰域方法認(rèn)為預(yù)測一個用戶對一個物品的評分凡人,需要參考和這個用戶相似的用戶對該物品的評分。用戶之間的相似度計算可以通過皮爾遜系數(shù)計算:w_{uv}=\frac{\sum_{i \in I}(r_{ui}-\hat{r}_u)*(r_{vi}-\hat{r}_v)}{\sqrt{\sum_{i \in I}(r_{ui}-\hat{r}_u)^2*\sum_{i \in I}(r_{vi}-\hat{r}_v)^2}}......(1)而基于物品的鄰域算法則是在預(yù)測用戶對物品的評分時會參考用戶對和物品相似的其他物品的評分叹阔,此時物品之間的相似度可以用3種衡量方式:余弦相似度挠轴、皮爾遜系數(shù)和帶修正的余弦相似度。3種衡量方式的公式對比如下圖:

基于物品的鄰域算法的3種不同衡量方式.jpg

隱語義模型和矩陣分解模型

??這兩種方法其實都是通過降維的方法將評分矩陣補全耳幢。怎么樣補全才算是對矩陣擾動最小呢岸晦?一般認(rèn)為如果補全后矩陣的特征值和補全前矩陣的特征值相差不大,就算是擾動比較小睛藻。SVD分解是早期常用的矩陣分解方法启上,其缺點在于計算復(fù)雜度很高,而且占用很大的存儲空間店印。隱語義模型(LFM)就是將大的稀疏矩陣用兩個小的矩陣相乘來表示冈在,此時就不需要用大量存儲空間來保存原始評分矩陣,此時兩個小的矩陣一般使用隨機數(shù)填充按摘,根據(jù)經(jīng)驗隨機數(shù)需要1/sqrt(F)成正比(F就是隱類的個數(shù))包券。LFM通過隱類將用戶和物品聯(lián)系在一起纫谅。但是一般來說,一個評分系統(tǒng)有些固有屬性和用戶物品無關(guān)溅固,而用戶也有屬性和物品無關(guān)付秕,物品也有屬性和用戶無關(guān)。此時就需要對三者加上偏置侍郭,即:\hat{r}_{ui}=\mu+b_u+b_i+p_u^T*q_i......(2)询吴,其中\mub_u亮元、b_i就分別代表了系統(tǒng)猛计、用戶和物品的固有屬性。
??當(dāng)然還可以對LFM繼續(xù)改進苹粟,比如考慮鄰域影響有滑,其實就是在上面公式(2)的基礎(chǔ)上再加上Item CF預(yù)測的評分結(jié)果跃闹,不過此時這個評分結(jié)果不是統(tǒng)計的嵌削,而是利用可學(xué)習(xí)的參數(shù)計算出來的。此時新的優(yōu)化公式如下:\hat{r_{ui}}=\mu+b_u+b_i+q_i^T*(p_u+\frac{1}{\sqrt{|N(u)|}}x_i^T*\sum_{j \in N(u)})y_jN(u)就是和物品相似的物品集合望艺,公式后面這一部分就體現(xiàn)出了鄰域物品的影響苛秕。而且上面公式對鄰域影響矩陣進行分解,從而大大降低了參數(shù)的數(shù)量和存儲空間找默。

加入時間信息

??有兩種方式加入時間信息艇劫,一種是基于鄰域的模型融合時間信息,一般是將時間信息融合到基于物品的鄰域模型中惩激,其實就是對相似物品的評分貢獻(xiàn)加上時間權(quán)重店煞。之前可以視為所有的相似物品評分貢獻(xiàn)權(quán)重都是1,但是考慮了時間因素后就需要提高用戶最近的評分行為對推薦結(jié)果的影響风钻,也就是加大近期行為物品的評分貢獻(xiàn)權(quán)重顷蟀。
??另一種是基于矩陣分解的模型融合時間信息,此時用戶評分矩陣不再是一個二維矩陣骡技,而是變成了一個三維矩陣鸣个。三維矩陣的分解可以參考這篇論文,評分優(yōu)化公式如下:\hat{r_{uit}}=\mu+b_u+b_i+b_t+p_u^T*q_i+x_u^T*y_t+s_i^T*z_t+\sum_fg_{u,f}*h_{i,f}*l_{t,f}書上說的是\sum_fg_{u,f}*h_{i,f}*l_{t,f}建模了用戶興趣隨時間影響的效應(yīng)布朦。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末囤萤,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子是趴,更是在濱河造成了極大的恐慌涛舍,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,546評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件唆途,死亡現(xiàn)場離奇詭異富雅,居然都是意外死亡缤削,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評論 3 395
  • 文/潘曉璐 我一進店門吹榴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來亭敢,“玉大人,你說我怎么就攤上這事图筹∷У叮” “怎么了?”我有些...
    開封第一講書人閱讀 164,911評論 0 354
  • 文/不壞的土叔 我叫張陵远剩,是天一觀的道長扣溺。 經(jīng)常有香客問我,道長瓜晤,這世上最難降的妖魔是什么锥余? 我笑而不...
    開封第一講書人閱讀 58,737評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮痢掠,結(jié)果婚禮上驱犹,老公的妹妹穿的比我還像新娘。我一直安慰自己足画,他們只是感情好雄驹,可當(dāng)我...
    茶點故事閱讀 67,753評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著淹辞,像睡著了一般医舆。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上象缀,一...
    開封第一講書人閱讀 51,598評論 1 305
  • 那天蔬将,我揣著相機與錄音,去河邊找鬼央星。 笑死霞怀,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的等曼。 我是一名探鬼主播里烦,決...
    沈念sama閱讀 40,338評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼禁谦!你這毒婦竟也來了胁黑?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,249評論 0 276
  • 序言:老撾萬榮一對情侶失蹤州泊,失蹤者是張志新(化名)和其女友劉穎丧蘸,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,696評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡力喷,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,888評論 3 336
  • 正文 我和宋清朗相戀三年刽漂,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片弟孟。...
    茶點故事閱讀 40,013評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡贝咙,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出拂募,到底是詐尸還是另有隱情庭猩,我是刑警寧澤,帶...
    沈念sama閱讀 35,731評論 5 346
  • 正文 年R本政府宣布陈症,位于F島的核電站蔼水,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏录肯。R本人自食惡果不足惜趴腋,卻給世界環(huán)境...
    茶點故事閱讀 41,348評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望论咏。 院中可真熱鬧优炬,春花似錦、人聲如沸潘靖。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,929評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽卦溢。三九已至,卻和暖如春秀又,著一層夾襖步出監(jiān)牢的瞬間单寂,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,048評論 1 270
  • 我被黑心中介騙來泰國打工吐辙, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留宣决,地道東北人。 一個月前我還...
    沈念sama閱讀 48,203評論 3 370
  • 正文 我出身青樓昏苏,卻偏偏與公主長得像尊沸,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子贤惯,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,960評論 2 355

推薦閱讀更多精彩內(nèi)容