DeepFM:A Factorization-Machine based Neural Network for CTR Prediction

來源:IJCAI17眯漩,DeepFM論文鏈接

DeepFM

由FM component和Deep component組成

  1. FM提取低階組合特征煌贴,Deep提取高階組合特征。不需要進(jìn)行預(yù)訓(xùn)練以及人工特征工程秀又。
  2. 共享feature embedding媒惕。FM和Deep共享輸入和feature embedding。不但使得訓(xùn)練更快,而且使得訓(xùn)練更加準(zhǔn)確靠益。

優(yōu)點(diǎn):

  1. 不需要預(yù)訓(xùn)練FM得到隱向量
  2. 不需要人工特征工程
  3. 能同時學(xué)習(xí)低階和高階的組合特征
  4. FM模塊和Deep模塊共享feature embedding

數(shù)據(jù)

原始數(shù)據(jù) = 種類特征(eg. gender, location) + 連續(xù)特征(eg. age) + label

  • 種類特征進(jìn)行one-hot編碼
  • 連續(xù)特征可直接使用丧肴,或者先進(jìn)行離散化在進(jìn)行one-hot編碼
  • 特征按照field分組

綜上:原始數(shù)據(jù)-> (x, label)
x = [xfield1,xfield2,xfield3,...,xfieldm]

DeepFM結(jié)構(gòu)圖:

DeepFM

計算公式:

$$y = sigmoid(y_{FM} + y_{DNN})$$

其中yFM為FM component的輸出,yDNN為DNN component的輸出胧后。y∈{0,1} 芋浮,為CTR預(yù)測概率。

FM component

FM component
$$y_{FM} = \left< x,y \right> + \sum_{i=1}^d\sum_{j=i+1}^d\left< V_{i},V_{j} \right>x_{i}\cdot x_{j}$$

FM component包含了加法單元和內(nèi)積單元壳快。
加法單元:提取一階特征纸巷,直接從原始特征提取。
內(nèi)積單元:原始特征先進(jìn)行embedding眶痰,然后由embedding后的輸出經(jīng)過內(nèi)積單元提取二階組合特征瘤旨。

最終維度:field_size + embedding_size
embedding_size對應(yīng)的是:!$\sum_{i=1}^d\sum_{j=i+1}^d\left< V_{i},V_{j} \right>x_{i}\cdot x_{j}$

FM component總結(jié):

  1. 實(shí)現(xiàn)了對一階和二階組合特征的建模
  2. 沒有使用預(yù)訓(xùn)練
  3. 沒有人工特征工程

Deep component

Deep component

用來提取高階組合特征。
原始特征首先經(jīng)過embedding層降維后竖伯,然后經(jīng)過多個全連接隱藏層輸出存哲,即yDNN

DeepFM:一階特征(FM)+二階特征(FM)+高階特征(DNN)

在DeepFM之前有其他幾個模型:

FNN與PNN的不足之處:
僅能提取高階組合特征,低階組合特征無法獲取七婴。

Wide&Deep的不足之處:
在Wide部分還需要進(jìn)行人工特征工程祟偷。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市打厘,隨后出現(xiàn)的幾起案子修肠,更是在濱河造成了極大的恐慌,老刑警劉巖户盯,帶你破解...
    沈念sama閱讀 223,126評論 6 520
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件嵌施,死亡現(xiàn)場離奇詭異,居然都是意外死亡先舷,警方通過查閱死者的電腦和手機(jī)艰管,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,421評論 3 400
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蒋川,“玉大人牲芋,你說我怎么就攤上這事∞嗲颍” “怎么了缸浦?”我有些...
    開封第一講書人閱讀 169,941評論 0 366
  • 文/不壞的土叔 我叫張陵,是天一觀的道長氮兵。 經(jīng)常有香客問我裂逐,道長,這世上最難降的妖魔是什么泣栈? 我笑而不...
    開封第一講書人閱讀 60,294評論 1 300
  • 正文 為了忘掉前任卜高,我火速辦了婚禮弥姻,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘掺涛。我一直安慰自己庭敦,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,295評論 6 398
  • 文/花漫 我一把揭開白布薪缆。 她就那樣靜靜地躺著秧廉,像睡著了一般。 火紅的嫁衣襯著肌膚如雪拣帽。 梳的紋絲不亂的頭發(fā)上疼电,一...
    開封第一講書人閱讀 52,874評論 1 314
  • 那天,我揣著相機(jī)與錄音减拭,去河邊找鬼蔽豺。 笑死,一個胖子當(dāng)著我的面吹牛峡谊,可吹牛的內(nèi)容都是我干的茫虽。 我是一名探鬼主播刊苍,決...
    沈念sama閱讀 41,285評論 3 424
  • 文/蒼蘭香墨 我猛地睜開眼既们,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了正什?” 一聲冷哼從身側(cè)響起啥纸,我...
    開封第一講書人閱讀 40,249評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎婴氮,沒想到半個月后斯棒,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,760評論 1 321
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡主经,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,840評論 3 343
  • 正文 我和宋清朗相戀三年荣暮,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片罩驻。...
    茶點(diǎn)故事閱讀 40,973評論 1 354
  • 序言:一個原本活蹦亂跳的男人離奇死亡穗酥,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出惠遏,到底是詐尸還是另有隱情砾跃,我是刑警寧澤,帶...
    沈念sama閱讀 36,631評論 5 351
  • 正文 年R本政府宣布节吮,位于F島的核電站抽高,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏透绩。R本人自食惡果不足惜翘骂,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,315評論 3 336
  • 文/蒙蒙 一壁熄、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧碳竟,春花似錦请毛、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,797評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至统翩,卻和暖如春仙蚜,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背厂汗。 一陣腳步聲響...
    開封第一講書人閱讀 33,926評論 1 275
  • 我被黑心中介騙來泰國打工委粉, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人娶桦。 一個月前我還...
    沈念sama閱讀 49,431評論 3 379
  • 正文 我出身青樓贾节,卻偏偏與公主長得像,于是被迫代替她去往敵國和親衷畦。 傳聞我的和親對象是個殘疾皇子栗涂,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,982評論 2 361

推薦閱讀更多精彩內(nèi)容