Paper Reading Note
URL: http://palm.seu.edu.cn/xgeng/files/ijcai18d.pdf
TL;DR
本文設(shè)計了一種輕量級CNN汇荐,并將年齡分布學(xué)習(xí)和年齡回歸統(tǒng)一到一個學(xué)習(xí)框架中絮短,在年齡預(yù)測任務(wù)上獲得了SOTA的性能。
Dataset/Algorithm/Model/Experiment Detail
Motivation
當(dāng)前性能最優(yōu)的年齡預(yù)測方法(Randking,DLDL方法)都存在一個問題:訓(xùn)練階段的目標(biāo)和模型性能判斷標(biāo)準(zhǔn)間存在不一致性。
比如,Randking方法是學(xué)習(xí)一系列的2分類器,但是預(yù)測時是整合多個分類器結(jié)果得到最終年齡預(yù)測;DLDL方法在訓(xùn)練時將年齡標(biāo)簽轉(zhuǎn)換為一個年齡分布首尼,學(xué)習(xí)目標(biāo)是擬合年齡分布,但是在衡量模型性能時卻計算預(yù)測年齡和真實年齡間的誤差言秸。
本文方法是對DLDL方法的擴(kuò)展软能,在訓(xùn)練loss中除了由預(yù)測分布和真實分布計算得到的loss部分,還根據(jù)預(yù)測分布得到預(yù)測的年齡举畸,從而計算預(yù)測年齡和真實年齡間的差作為loss的另外一部分查排。
Network Architecture
loss
網(wǎng)絡(luò)最后一層FC輸出 x 通過softmax轉(zhuǎn)換為年齡預(yù)測分布
年齡真實標(biāo)簽 y 轉(zhuǎn)換為年齡分布如下
通過計算網(wǎng)絡(luò)預(yù)測年齡分布和真實年齡分布間的KL散度,來衡量分布間的距離
由8式得到的 ^pk 表示預(yù)測年齡為 lk 的概率抄沮,那么將預(yù)測年齡的期望作為年齡的預(yù)測值
那么跋核,計算預(yù)測年齡和真實年齡間的絕對誤差可以衡量模型預(yù)測年齡的準(zhǔn)確度
最后麸塞,網(wǎng)絡(luò)訓(xùn)練的loss由以上兩部分loss加權(quán)得到:
從而可以看出腿堤,本文方法將訓(xùn)練目標(biāo)和最終衡量指標(biāo)整合到一個學(xué)習(xí)框架中爽柒。
本文方法特點(diǎn)總結(jié)如下:
- 對比于之前CNN-based年齡預(yù)測方法布讹,該網(wǎng)絡(luò)將網(wǎng)絡(luò)最后的FC替換為一個Max-pooling和一個global-average-pooling(GAP),圖中用HPooling(Hybrid-pooling)表示刻伊。
- loss計算包含兩個部分露戒,一部分用于衡量年齡分布距離,另一項衡量年齡預(yù)測誤差捶箱。
Ranking is Learning Label Distribution
另外智什,本文從年齡標(biāo)簽編碼的角度分析得出:Ranking方法實際是DLDL方法的特例。
以上圖(a)是DLDL方法對年齡標(biāo)簽進(jìn)行編碼后的年齡概率密度分布丁屎,圖(b)表示圖(a)中各分布的累計分布函數(shù)荠锭,圖(c)表示了一減累計分布和Ranking(黑線)方法對應(yīng)的編碼向量,可以看出Ranking方法是對應(yīng)DLDL在 σ→0 時的特例晨川。具體數(shù)學(xué)上的推導(dǎo)證明可以見論文证九。
Experiment
-
本文方法在3個年齡數(shù)據(jù)集上均優(yōu)于其他方法。
image -
模型參數(shù)量及運(yùn)行時間對比础爬。本文網(wǎng)絡(luò)結(jié)構(gòu)包含更少的參數(shù)甫贯,運(yùn)行速度更快吼鳞。
image -
本文還有一個有意思的地方是看蚜,可視化了模型對不同年齡人臉圖像的score map∨庾溃可以看出模型對于不同年齡人臉使用不同的pattern進(jìn)行年齡識別供炎。
image
Thoughts
相比于經(jīng)典的DLDL方法,只是在loss中加入一項疾党,即可以獲得明顯的性能改善音诫,感覺很本質(zhì)。另外雪位,文章中對不同年齡人臉圖score map的可視化分析比較有意思竭钝。