推薦系統(tǒng)排序算法--DeepFM模型

1匾七、背景

對于一個(gè)基于CTR預(yù)估的推薦系統(tǒng)赦邻,最重要的是學(xué)習(xí)到用戶點(diǎn)擊行為背后隱含的特征組合啸蜜。在不同的推薦場景中坑雅,低階組合特征或者高階組合特征可能都會(huì)對最終的CTR產(chǎn)生影響。

之前介紹的因子分解機(jī)(Factorization Machines, FM)通過對于每一維特征的隱變量內(nèi)積來提取特征組合衬横。最終的結(jié)果也非常好裹粤。但是,雖然理論上來講FM可以對高階特征組合進(jìn)行建模蜂林,但實(shí)際上因?yàn)橛?jì)算復(fù)雜度的原因一般都只用到了二階特征組合遥诉。那么對于高階的特征組合來說拇泣,我們很自然的想法,通過多層的神經(jīng)網(wǎng)絡(luò)即DNN去解決矮锈。

DNN的局限

下面的圖片來自于張俊林教授在AI大會(huì)上所使用的PPT挫酿。我們之前也介紹過了,對于離散特征的處理愕难,我們使用的是將特征轉(zhuǎn)換成為one-hot的形式,但是將One-hot類型的特征輸入到DNN中惫霸,會(huì)導(dǎo)致網(wǎng)絡(luò)參數(shù)太多:

1猫缭、DNN參數(shù)過多

如何解決這個(gè)問題呢,類似于FFM中的思想壹店,將特征分為不同的field:

2猜丹、劃分field

再加兩層的全鏈接層,讓Dense Vector進(jìn)行組合硅卢,那么高階特征的組合就出來了

3射窒、組合高階特征

但是低階和高階特征組合隱含地體現(xiàn)在隱藏層中,如果我們希望把低階特征組合單獨(dú)建模将塑,然后融合高階特征組合脉顿。

4、怎么把低價(jià)特征單獨(dú)建模

即將DNN與FM進(jìn)行一個(gè)合理的融合:

5点寥、融合DNN與FM

二者的融合總的來說有兩種形式艾疟,一是并行結(jié)構(gòu),二是串行結(jié)構(gòu):

6敢辩、并行結(jié)構(gòu)
7蔽莱、串行結(jié)構(gòu)

而我們今天要講到的DeepFM,就是并行結(jié)構(gòu)中的一種典型代表戚长。

2盗冷、DeepFM模型

2.1 整體結(jié)構(gòu)

我們先來看一下DeepFM的模型結(jié)構(gòu):

8、 Wide & deep architecture of DeepFM

deepFM包含兩部分:神經(jīng)網(wǎng)絡(luò)部分與因子分解機(jī)部分同廉,分別負(fù)責(zé)低階特征的提取和高階特征的提取仪糖。這兩部分共享同樣的輸入。DeepFM的預(yù)測結(jié)果可以寫為:

? ??????????????????????????????????????\hat{y} =sigmoid(y_{FM} + y_{DNN} )

2.2 FM部分

FM部分的詳細(xì)結(jié)構(gòu)如下:

9迫肖、 The architecture of FM

FM部分是一個(gè)因子分解機(jī)乓诽。關(guān)于因子分解機(jī)可以參閱文章[Rendle, 2010] Steffen Rendle. Factorization machines. In ICDM, 2010.。因?yàn)橐肓穗[變量的原因咒程,對于幾乎不出現(xiàn)或者很少出現(xiàn)的隱變量鸠天,F(xiàn)M也可以很好的學(xué)習(xí)。FM的輸出公式為:

? ??????????????????????????????????????y_{FM} =w_{0}+ \sum_{i=1}^n w_{i} x_{i}+ \sum_{i=1}^{n} \sum_{j=i+1}^n <v_{i}, v_{j}> x_{i} x_{j}

2.3 深度部分

10帐姻、 The architecture of DNN

深度部分是一個(gè)前饋神經(jīng)網(wǎng)絡(luò)稠集。與圖像或者語音這類輸入不同奶段,圖像語音的輸入一般是連續(xù)而且密集的,然而用于CTR的輸入一般是及其稀疏的剥纷。因此需要重新設(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu)痹籍。具體實(shí)現(xiàn)中為,在第一層隱含層之前晦鞋,引入一個(gè)嵌入層來完成將輸入向量壓縮到低維稠密向量蹲缠。

11、The structure of the embedding layer

嵌入層(embedding layer)的結(jié)構(gòu)如上圖所示悠垛。當(dāng)前網(wǎng)絡(luò)結(jié)構(gòu)有兩個(gè)有趣的特性:

1线定、盡管不同field的輸入長度不同,但是embedding之后向量的長度均為k确买。

2斤讥、在FM里得到的隱變量V_{i k} 現(xiàn)在作為了嵌入層網(wǎng)絡(luò)的權(quán)重。

這里的第二點(diǎn)如何理解呢湾趾,假設(shè)我們的k=5芭商,首先,對于輸入的一條記錄搀缠,同一個(gè)field 只有一個(gè)位置是1铛楣,那么在由輸入得到dense vector的過程中,輸入層只有一個(gè)神經(jīng)元起作用艺普,得到的dense vector其實(shí)就是輸入層到embedding層該神經(jīng)元相連的五條線的權(quán)重蛉艾,即v_{i1} v_{i2} 衷敌,v_{i3} 勿侯,v_{i4} v_{i5} 缴罗。這五個(gè)值組合起來就是我們在FM中所提到的v_{i} 助琐。在FM部分和DNN部分,這一塊是共享權(quán)重的面氓,對同一個(gè)特征來說兵钮,得到的Vi是相同的。

參考文獻(xiàn):

論文:DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

推薦系統(tǒng)遇上深度學(xué)習(xí)(三)--DeepFM模型理論和實(shí)踐

原代碼地址:https://github.com/ChenglongChen/tensorflow-DeepFM

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末舌界,一起剝皮案震驚了整個(gè)濱河市掘譬,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌呻拌,老刑警劉巖葱轩,帶你破解...
    沈念sama閱讀 212,454評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡靴拱,警方通過查閱死者的電腦和手機(jī)垃喊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來袜炕,“玉大人本谜,你說我怎么就攤上這事≠司剑” “怎么了乌助?”我有些...
    開封第一講書人閱讀 157,921評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長陌知。 經(jīng)常有香客問我他托,道長,這世上最難降的妖魔是什么纵诞? 我笑而不...
    開封第一講書人閱讀 56,648評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮培遵,結(jié)果婚禮上浙芙,老公的妹妹穿的比我還像新娘。我一直安慰自己籽腕,他們只是感情好嗡呼,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,770評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著皇耗,像睡著了一般南窗。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上郎楼,一...
    開封第一講書人閱讀 49,950評論 1 291
  • 那天万伤,我揣著相機(jī)與錄音,去河邊找鬼呜袁。 笑死敌买,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的阶界。 我是一名探鬼主播虹钮,決...
    沈念sama閱讀 39,090評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼膘融!你這毒婦竟也來了芙粱?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,817評論 0 268
  • 序言:老撾萬榮一對情侶失蹤氧映,失蹤者是張志新(化名)和其女友劉穎春畔,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,275評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡拐迁,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,592評論 2 327
  • 正文 我和宋清朗相戀三年蹭劈,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片线召。...
    茶點(diǎn)故事閱讀 38,724評論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡铺韧,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出缓淹,到底是詐尸還是另有隱情哈打,我是刑警寧澤,帶...
    沈念sama閱讀 34,409評論 4 333
  • 正文 年R本政府宣布讯壶,位于F島的核電站料仗,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏伏蚊。R本人自食惡果不足惜立轧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,052評論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望躏吊。 院中可真熱鬧氛改,春花似錦、人聲如沸比伏。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,815評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽赁项。三九已至葛躏,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間悠菜,已是汗流浹背舰攒。 一陣腳步聲響...
    開封第一講書人閱讀 32,043評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留悔醋,地道東北人芒率。 一個(gè)月前我還...
    沈念sama閱讀 46,503評論 2 361
  • 正文 我出身青樓,卻偏偏與公主長得像篙顺,于是被迫代替她去往敵國和親偶芍。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,627評論 2 350

推薦閱讀更多精彩內(nèi)容