交替最小二乘法(ALS)

ALS是alternating least squares的縮寫 , 意為交替最小二乘法;而ALS-WR是alternating-least-squares with weighted-λ -regularization的縮寫首启,意為加權(quán)正則化交替最小二乘法。該方法常用于基于矩陣分解的推薦系統(tǒng)中毅桃。例如:將用戶(user)對商品(item)的評分矩陣分解為兩個矩陣:一個是用戶對商品隱含特征的偏好矩陣,另一個是商品所包含的隱含特征的矩陣准夷。在這個矩陣分解的過程中,評分缺失項(xiàng)得到了填充衫嵌,也就是說我們可以基于這個填充的評分來給用戶最商品推薦了。
ALS
由于評分?jǐn)?shù)據(jù)中有大量的缺失項(xiàng)楔绞,傳統(tǒng)的矩陣分解SVD(奇異值分解)不方便處理這個問題唇兑,而ALS能夠很好的解決這個問題。對于R(m×n)的矩陣扎附,ALS旨在找到兩個低維矩陣X(m×k)和矩陣Y(n×k),來近似逼近R(m×n)察纯,即:

其中R(m×n)代表用戶對商品的評分矩陣,X(m×k)代表用戶對隱含特征的偏好矩陣香伴,Y(n×k)表示商品所包含隱含特征的矩陣,T表示矩陣Y的轉(zhuǎn)置具则。實(shí)際中,一般取k<<min(m, n), 也就是相當(dāng)于降維了博肋。這里的低維矩陣,有的地方也叫低秩矩陣匪凡。
為了找到使低秩矩陣X和Y盡可能地逼近R,需要最小化下面的平方誤差損失函數(shù):
gif.latex
其中xu
(1×k)表示示用戶u的偏好的隱含特征向量病游,yi
(1×k)表示商品i包含的隱含特征向量, rui
表示用戶u對商品i的評分, 向量xu
和yi
的內(nèi)積xu
T
yi
是用戶u對商品i評分的近似。

損失函數(shù)一般需要加入正則化項(xiàng)來避免過擬合等問題衬衬,我們使用L2正則化,所以上面的公式改造為:
gif.latex
其中λ是正則化項(xiàng)的系數(shù)滋尉。
到這里,協(xié)同過濾就成功轉(zhuǎn)化成了一個優(yōu)化問題狮惜。由于變量xu和yi耦合到一起,這個問題并不好求解碾篡,所以我們引入了ALS,也就是說我們可以先固定Y(例如隨機(jī)初始化X)耽梅,然后利用公式(2)先求解X薛窥,然后固定X诅迷,再求解Y,如此交替往復(fù)直至收斂罢杉,即所謂的交替最小二乘法求解法趟畏。
具體求解方法說明如下:
先固定Y, 將損失函數(shù)L(X,Y)對*xu
*求偏導(dǎo)赋秀,并令導(dǎo)數(shù)=0,得到:


同理固定X猎莲,可得:

其中ru(1×n)是R的第u行,ri(1×m)是R的第i列, I是k×k的單位矩陣著洼。
迭代步驟:首先隨機(jī)初始化Y,利用公式(3)更新得到X, 然后利用公式(4)更新Y, 直到均方根誤差變RMSE化很小或者到達(dá)最大迭代次數(shù)身笤。


ALS-WR
上文提到的模型適用于解決有明確評分矩陣的應(yīng)用場景,然而很多情況下液荸,用戶沒有明確反饋對商品的偏好,也就是沒有直接打分娇钱,我們只能通過用戶的某些行為來推斷他對商品的偏好。比如涡尘,在電視節(jié)目推薦的問題中响迂,對電視節(jié)目收看的次數(shù)或者時長考抄,這時我們可以推測次數(shù)越多川梅,看得時間越長,用戶的偏好程度越高然遏,但是對于沒有收看的節(jié)目,可能是由于用戶不知道有該節(jié)目待侵,或者沒有途徑獲取該節(jié)目,我們不能確定的推測用戶不喜歡該節(jié)目。ALS-WR通過置信度權(quán)重來解決這些問題:對于更確信用戶偏好的項(xiàng)賦以較大的權(quán)重怨酝,對于沒有反饋的項(xiàng),賦以較小的權(quán)重农猬。ALS-WR模型的形式化說明如下:
ALS-WR的目標(biāo)函數(shù):

其中α是置信度系數(shù)。
求解方式還是最小二乘法:

其中Cu
其中Cu
是n×n的對角矩陣斤葱,Ci是m×m的對角矩陣;Cuii = cui, Ciii = cii揍堕。
參考來源:http://www.fuqingchuan.com/2015/03/812.html

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市衩茸,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌递瑰,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,383評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件抖部,死亡現(xiàn)場離奇詭異,居然都是意外死亡慎颗,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,522評論 3 385
  • 文/潘曉璐 我一進(jìn)店門俯萎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人夫啊,你說我怎么就攤上這事函卒∑裁校” “怎么了?”我有些...
    開封第一講書人閱讀 157,852評論 0 348
  • 文/不壞的土叔 我叫張陵熊榛,是天一觀的道長。 經(jīng)常有香客問我玄坦,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,621評論 1 284
  • 正文 為了忘掉前任豺总,我火速辦了婚禮,結(jié)果婚禮上园欣,老公的妹妹穿的比我還像新娘。我一直安慰自己沸枯,他們只是感情好日矫,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,741評論 6 386
  • 文/花漫 我一把揭開白布哪轿。 她就那樣靜靜地躺著,像睡著了一般翔怎。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上赤套,一...
    開封第一講書人閱讀 49,929評論 1 290
  • 那天,我揣著相機(jī)與錄音容握,去河邊找鬼。 笑死剔氏,一個胖子當(dāng)著我的面吹牛塑猖,可吹牛的內(nèi)容都是我干的谈跛。 我是一名探鬼主播,決...
    沈念sama閱讀 39,076評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼感憾,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了吹菱?” 一聲冷哼從身側(cè)響起彭则,我...
    開封第一講書人閱讀 37,803評論 0 268
  • 序言:老撾萬榮一對情侶失蹤鳍刷,失蹤者是張志新(化名)和其女友劉穎俯抖,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,265評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡搔啊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,582評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了北戏。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,716評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡嗜愈,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出蠕嫁,到底是詐尸還是另有隱情,我是刑警寧澤剃毒,帶...
    沈念sama閱讀 34,395評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站赘阀,受9級特大地震影響益缠,放射性物質(zhì)發(fā)生泄漏基公。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,039評論 3 316
  • 文/蒙蒙 一酌媒、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧秒咨,春花似錦喇辽、人聲如沸雨席。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,798評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至糙置,卻和暖如春云茸,著一層夾襖步出監(jiān)牢的瞬間谤饭,已是汗流浹背懊纳。 一陣腳步聲響...
    開封第一講書人閱讀 32,027評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留嗤疯,地道東北人。 一個月前我還...
    沈念sama閱讀 46,488評論 2 361
  • 正文 我出身青樓闺兢,卻偏偏與公主長得像,于是被迫代替她去往敵國和親屋谭。 傳聞我的和親對象是個殘疾皇子阱佛,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,612評論 2 350

推薦閱讀更多精彩內(nèi)容

  • 第一部分 算法原理及推導(dǎo) 1.1 算法原理介紹 背景介紹:ALS是交替最小二乘的簡稱凑术,在機(jī)器學(xué)習(xí)上下文中,ALS...
    sheetakiki閱讀 13,007評論 0 11
  • Spark的MLlib實(shí)現(xiàn)了協(xié)同過濾(Collaborative Filtering)這個功能淮逊。官網(wǎng)文檔鏈接 熟悉...
    shohokuooo閱讀 7,059評論 0 53
  • 推薦系統(tǒng)有著廣泛的應(yīng)用,電影推薦扶踊,商品推薦等都用到推薦系統(tǒng)。本文介紹協(xié)同過濾算法的基本原理秧耗,進(jìn)而理解推薦系統(tǒng)的實(shí)現(xiàn)...
    kamidox閱讀 10,952評論 8 42
  • 一、實(shí)驗(yàn)?zāi)康?學(xué)習(xí)使用 weka 中的常用分類器分井,完成數(shù)據(jù)分類任務(wù)车猬。 二尺锚、實(shí)驗(yàn)內(nèi)容 了解 weka 中 explo...
    yigoh閱讀 8,500評論 5 4
  • 概述及標(biāo)簽體系搭建 1 概述 隨著信息技術(shù)的迅速發(fā)展和信息內(nèi)容的日益增長,“信息過載”問題愈來愈嚴(yán)重瘫辩,愈發(fā)帶來很大...
    JinkeyAI閱讀 22,769評論 10 241