推薦算法之—FM

1、什么是FM算法

FM即Factor Machine店枣,因子分解機(jī)

2买置、為什么需要FM

1)粪糙、特征組合是許多機(jī)器學(xué)習(xí)建模過程中遇到的問題,如果對特征直接建模忿项,很有可能忽略掉特征與特征之間的關(guān)聯(lián)信息蓉冈,一次可以通過構(gòu)建新的交叉特征這一特征組合方式提高模型的效果。

2)倦卖、高維的稀疏矩陣是實(shí)際工程中常見的問題洒擦,并且直接導(dǎo)致計(jì)算量過大,特征權(quán)值更新緩慢怕膛。試想一個(gè)10000100的表熟嫩,每一列都有8中元素,經(jīng)過one-hot編碼之后褐捻,會(huì)產(chǎn)生一個(gè)10000800的表掸茅。因此表中每一元素只有100個(gè)值為1,700個(gè)值為0

而FM的優(yōu)勢就在于對這兩方面問題的處理。首先是特征組合柠逞,通過兩兩特征組合昧狮,引入交叉項(xiàng)特征(二階特征),提高模型得分板壮;其次是高維災(zāi)難逗鸣,通過引入隱向量(對參數(shù)矩陣進(jìn)行分解),完成特征參數(shù)的估計(jì)

3绰精、FM 用在哪

我們已經(jīng)知道FM可以解決特征組合以及高維稀疏矩陣問題撒璧,而實(shí)際業(yè)務(wù)場景中,電商笨使、豆瓣等推薦系統(tǒng)的場景是使用最廣泛的領(lǐng)域卿樱,打個(gè)比方,小王只在豆瓣上瀏覽過20部電影硫椰,而豆瓣上面有20000部電影繁调,如果構(gòu)建一個(gè)基于小王的電影矩陣萨蚕,毫無疑問,里面講有199980個(gè)元素全為0.而類似這樣的問題就可以通過FM來解決

4蹄胰、FM長什么樣

在展示FM算法之前岳遥,我們先回顧一下最常見的線性表達(dá)式:

image.png

其中[圖片上傳失敗W0為初始權(quán)重值,或者理解為偏置項(xiàng)裕寨,Wi為每個(gè)特征 xi 對應(yīng)的權(quán)重值寒随,可以看到,這種線性表達(dá)式只描述了每個(gè)特征和輸出的關(guān)系帮坚。

FM的表達(dá)式如下,可觀察到互艾,只是在線性表達(dá)式后面加入了新的交叉項(xiàng)特征及對應(yīng)的權(quán)值试和。

image.png

5、FM交叉項(xiàng)的展開

1)尋找交叉項(xiàng)

FM表達(dá)式的求解核心在于對交叉項(xiàng)的求解纫普。下面是很多人用來求解交叉項(xiàng)的展開式阅悍,對于第一次接觸FM算法的人來說可能會(huì)有疑惑,不知道公式怎么展開的昨稼,接下來筆者會(huì)手動(dòng)推導(dǎo)一遍节视。

image.png

設(shè)有3個(gè)變量(特征)x1,x2,x3,每個(gè)特征的隱變量分別為v1=(1,2,3)、v2=(4,5,6)假栓、v3=(1,2,1)即:


image.png

設(shè)交叉項(xiàng)所組成的權(quán)矩陣W為對稱矩陣寻行,之所以設(shè)為對稱矩陣是因?yàn)閷ΨQ矩陣可以用向量乘以向量的轉(zhuǎn)置代替的性質(zhì)。

那么W=VVT ,即



所以:


image.png

實(shí)際上我們考慮的交叉項(xiàng)應(yīng)該是排除自身組合的項(xiàng)匾荆,即對于x1x1,x2x2,x3x3不認(rèn)為是交叉項(xiàng)拌蜘,那么真正的交叉項(xiàng)為x1x2,x1x3,x2x1,x2x3,x3x1,x3x2。
去重后牙丽,交叉項(xiàng)即:x1x2,x1x3简卧,x2x3。這也是出現(xiàn)1/2的原因

2)交叉項(xiàng)權(quán)值轉(zhuǎn)換

對交叉項(xiàng)有了基本了解后烤芦,下面將進(jìn)行公式的分解举娩,還是以n=3為例,


image.png

3)交叉項(xiàng)展開式

上面的例子是對3個(gè)特征做的交叉項(xiàng)推導(dǎo)构罗,因此對具有n個(gè)特征铜涉,F(xiàn)M的交叉項(xiàng)公式就可推廣為:


image.png

我們還可以進(jìn)一步分解:


image.png

所以FM算法的交叉項(xiàng)最終展開為:


image.png

6、權(quán)值求解

利用梯度下降法绰播,通過求損失函數(shù)對特征(輸入項(xiàng))的導(dǎo)數(shù)計(jì)算出梯度骄噪,從而更新權(quán)值。設(shè)m為樣本個(gè)數(shù)θ為權(quán)值蠢箩。

如果是回歸問題链蕊,損失函數(shù)一般是均方誤差(MSE)即事甜,最小二乘:


image.png

所以回歸問題的損失函數(shù)對權(quán)值的梯度(導(dǎo)數(shù))為:


image.png

如果是二分類問題,損失函數(shù)一般為logit loss:
image.png

其中滔韵,σ表示是階躍函數(shù)sigmoid逻谦。


image.png

所以分類問題的損失函數(shù)對權(quán)值的梯度(導(dǎo)數(shù))為:


image.png

相應(yīng)的,對于常數(shù)項(xiàng)陪蜻、一次項(xiàng)邦马、交叉項(xiàng)的導(dǎo)數(shù)分為:
image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市宴卖,隨后出現(xiàn)的幾起案子滋将,更是在濱河造成了極大的恐慌,老刑警劉巖症昏,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件随闽,死亡現(xiàn)場離奇詭異,居然都是意外死亡肝谭,警方通過查閱死者的電腦和手機(jī)掘宪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來攘烛,“玉大人魏滚,你說我怎么就攤上這事》厥” “怎么了鼠次?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長芋齿。 經(jīng)常有香客問我须眷,道長,這世上最難降的妖魔是什么沟突? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任花颗,我火速辦了婚禮,結(jié)果婚禮上惠拭,老公的妹妹穿的比我還像新娘扩劝。我一直安慰自己,他們只是感情好职辅,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布棒呛。 她就那樣靜靜地躺著,像睡著了一般域携。 火紅的嫁衣襯著肌膚如雪簇秒。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天秀鞭,我揣著相機(jī)與錄音趋观,去河邊找鬼扛禽。 笑死,一個(gè)胖子當(dāng)著我的面吹牛皱坛,可吹牛的內(nèi)容都是我干的编曼。 我是一名探鬼主播,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼剩辟,長吁一口氣:“原來是場噩夢啊……” “哼掐场!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起贩猎,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤熊户,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后吭服,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體敏弃,經(jīng)...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年噪馏,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片绿饵。...
    茶點(diǎn)故事閱讀 38,018評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡欠肾,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出拟赊,到底是詐尸還是另有隱情刺桃,我是刑警寧澤,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布吸祟,位于F島的核電站瑟慈,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏屋匕。R本人自食惡果不足惜葛碧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望过吻。 院中可真熱鬧进泼,春花似錦、人聲如沸纤虽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽逼纸。三九已至洋措,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間杰刽,已是汗流浹背菠发。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工王滤, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人雷酪。 一個(gè)月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓淑仆,卻偏偏與公主長得像,于是被迫代替她去往敵國和親哥力。 傳聞我的和親對象是個(gè)殘疾皇子蔗怠,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,762評論 2 345