論文筆記 Finding Tiny Faces in the Wild with Generative Adversarial Network

文章來源:CVPR? 2018

下載鏈接:Paper Download


解決的問題:

無約束條件下的低分辨率的人臉檢測(即小人臉檢測)


文章內(nèi)容

目前人臉檢測主要面臨的挑戰(zhàn)是:

?(1) 低分辨率的人臉缺乏詳細(xì)的細(xì)節(jié)信息稿存,以及圖像模糊等問題各淀。

?(2) 目前CNN模型卷積核步長太長瞒御,對(duì)于低分辨率人臉識(shí)別容易丟失大部分信息泥耀。

?本文算法的創(chuàng)新點(diǎn):

(1) 提出一種新的人臉檢測的統(tǒng)一端到端卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),采用超分辨率和細(xì)化網(wǎng)絡(luò)生成真實(shí)清晰的高分辨率圖像讥裤,并引入判別網(wǎng)絡(luò)對(duì)人臉與非人臉進(jìn)行分類放棒。

(2) 引入新的判別器loss。

?本文算法的核心思想:

本文方法主要是針對(duì)實(shí)際應(yīng)用而提出的人臉檢測算法坞琴,由于在無約束的環(huán)境下哨查,人臉可能會(huì)以模糊逗抑、側(cè)臉剧辐、低分辨率等方式呈現(xiàn)寒亥。針對(duì)該問題,作者通過采用生成對(duì)抗網(wǎng)絡(luò)(GAN)直接從模糊的低分辨率人臉中生成清晰的高分辨率人臉荧关,然后進(jìn)行人臉檢測溉奕。對(duì)于生成的超分辨率圖像,可能是非人臉忍啤,因此作者在鑒別器網(wǎng)絡(luò)中加入分類分支來判斷生成圖像是人臉還是非人臉加勤,從而增強(qiáng)人臉檢測算法的魯棒性。下圖為本文算法的網(wǎng)絡(luò)結(jié)構(gòu)圖同波。

Figure 1. The pipeline of the proposed tiny face detector system.

對(duì)于本文的GAN網(wǎng)絡(luò)鳄梅,生成器包含兩個(gè)子網(wǎng)絡(luò):超分辨率網(wǎng)絡(luò)和細(xì)化網(wǎng)絡(luò);判別器中加入分支網(wǎng)絡(luò)未檩,用于區(qū)分人臉戴尸、非人臉和生成圖片、真實(shí)圖片冤狡。超分辨率網(wǎng)絡(luò)(SRN)對(duì)小人臉進(jìn)行小尺度上采樣孙蒙,在較大尺度上減小偽影,提高上采樣圖像質(zhì)量悲雳。細(xì)化網(wǎng)絡(luò)(network, RN)可以恢復(fù)上采樣圖像中缺失的一些細(xì)節(jié)挎峦,生成清晰的高分辨率圖像進(jìn)行分類。鑒別子網(wǎng)絡(luò)利用一種新的損失函數(shù)合瓢,使鑒別器網(wǎng)絡(luò)同時(shí)區(qū)分real/fake face 和 face/non-face(即區(qū)分是生成器合成的圖像還是ground truth圖像坦胶,以及是人臉還是非人臉)。該算法的損失函數(shù)主要包括三部分晴楔,分別為:

??(1)?Pixel-wise loss:MSE loss迁央,通過像素級(jí)的MSE損失來強(qiáng)制生成器的輸出接近超分辨率的ground truth值,具體公式如圖2所示滥崩。?

???(2)?Adversarial loss:促進(jìn)生成器生成更逼真的圖片岖圈,具體公式如圖2所示。?

????(3)?Classification loss:其作用是為了使生成網(wǎng)絡(luò)重構(gòu)的圖像更易于分類钙皮,同時(shí)抑制非人臉轉(zhuǎn)變?yōu)槿四樀倪^程蜂科,(如,將模糊桌子轉(zhuǎn)變成人臉的過程)短条,具體公式如圖2所示 导匣。

圖2 本文算法所用的損失函數(shù)

圖2中Classification loss存在一個(gè)問題,文章介紹yn=1表示人臉茸时,而yn=0表示非人臉贡定。那么,當(dāng)yi=0時(shí)可都,log(yi-Dθ(IiHR))該如何取值缓待,文中未對(duì)此進(jìn)行說明(或許本人理解錯(cuò)誤蚓耽,此文僅供參考)。

最終將上圖中三個(gè)損失函數(shù)相結(jié)合旋炒,得到最終的objective function步悠,其公式如圖3所示:

圖3?objective function

圖4中給出了本文GAN網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)表。其中Generator網(wǎng)絡(luò)使用deep CNN, batch-normalization, ReLU瘫镇,而Discriminator使用VGG19網(wǎng)絡(luò)鼎兽。

Figure 4. Architecture of the generator and discriminator network. “conv” represents a convolutional layer, “x8” denotes a residual block which has 8 convolutional layers, “de-conv” means a fractionally-stride convolutional layer, “2x” denotes up-sampling by a factor of 2, and “fc” indicates a fully connected layer.

實(shí)驗(yàn)結(jié)果

本文算法在WIDER FACE和FDDB兩個(gè)公開的人臉檢測數(shù)據(jù)集上進(jìn)行訓(xùn)練以及測試。Trade-off weights α = 0.001 and β = 0.01铣除。另外谚咬,圖1中的MB-FCN detector是17年提出的一種人臉檢測算法,知乎上有關(guān)于其的詳細(xì)介紹尚粘,本文中僅使用它在數(shù)據(jù)集中隨機(jī)截取人臉圖片和非人臉圖片序宦,用于訓(xùn)練網(wǎng)絡(luò)的輸入。其中背苦,訓(xùn)練使用的low-resolution images通過下采樣生成互捌,high-resolution images使用雙三次插值生成。實(shí)驗(yàn)結(jié)果如下圖所示行剂。

Figure 5. Qualitative detection results of our proposed method. Green bounding boxes are ground truth annotations and red bounding boxes are the results from our method. Best seen on the computer, in color and zoomed in.

文中還對(duì)各個(gè)損失函數(shù)的性能進(jìn)行了驗(yàn)證秕噪,即Ablation Studies, 其性能對(duì)比結(jié)果如下圖厚宰。

Figure 6. Performance of the baseline model trained with and without GAN, refinement network, adversarial loss and classification loss on the WIDER FACE invalidation set.

本文方法與state-of-the-art方法對(duì)比的實(shí)驗(yàn)結(jié)果如下圖腌巾。

Figure 7. On the WIDER FACE validation set, we compare our method with several state-of-the-art methods: MSCNN[31], MTTCNN[33], CMS-RCNN[37], HR[10], SSH[19], SFD[35]. The average precision (AP) is reported in the legend. Best viewed in color.

本文方法性能提升的原因

(1)本文方法主要是針對(duì)無約束、低分辨率的人臉進(jìn)行檢測铲觉,而這種情況下的人臉大部分是模糊不清晰的澈蝙。既然這些人臉分辨率低,所以作者就通過所設(shè)計(jì)的網(wǎng)絡(luò)(超分辨率網(wǎng)絡(luò)SRN)將其分辨率變大撵幽,這樣得到的圖像可能是不清晰的灯荧,因此作者就通過細(xì)化網(wǎng)絡(luò)將其變清晰,從而使生成的圖像含有詳細(xì)的細(xì)節(jié)信息盐杂,以便于人臉和非人臉的判別逗载。基于這樣的思路链烈,網(wǎng)絡(luò)均可將輸入的低分辨率人臉合成高分辨率的人臉厉斟,同時(shí)也可以準(zhǔn)確鑒別合成圖像是否是人臉。

(2)本文方法在鑒別器網(wǎng)絡(luò)中加入了分類分支强衡,這可以抑制低分辨率的非人臉圖像向人臉圖像轉(zhuǎn)化擦秽。GAN網(wǎng)絡(luò)本來就是用來生成我們所期望輸出的圖像,這樣鑒別器同樣可以引導(dǎo)非人臉圖像向人臉圖像轉(zhuǎn)化(如GAN網(wǎng)格可以將低分辨率模糊的桌子引導(dǎo)生成至清晰人臉),所以為了阻止該過程的發(fā)生感挥,作者引入了Classification loss缩搅,當(dāng)生成初步可判斷的非人臉圖像時(shí),網(wǎng)絡(luò)就可以直接阻止生成網(wǎng)絡(luò)將其合成至人臉圖像链快。


相關(guān)參考:Finding Tiny Faces in the Wild with Generative Adversarial NetworkFinding Tiny Faces in the Wild with Generative Adversarial Network 論文學(xué)習(xí)?


內(nèi)容說明:

博客:論文筆記 | 低分辨率人臉識(shí)別:Finding Tiny Faces in the Wild with Generative Adversarial Network(AI_ISCAS)同為本人所寫眉尸,兩者之間所涉及的內(nèi)容幾乎相同域蜗。

上述內(nèi)容僅個(gè)人的點(diǎn)滴粗見,如有不當(dāng)之處噪猾,請(qǐng)同行批評(píng)指正霉祸。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市袱蜡,隨后出現(xiàn)的幾起案子丝蹭,更是在濱河造成了極大的恐慌,老刑警劉巖坪蚁,帶你破解...
    沈念sama閱讀 218,941評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件奔穿,死亡現(xiàn)場離奇詭異,居然都是意外死亡敏晤,警方通過查閱死者的電腦和手機(jī)贱田,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來嘴脾,“玉大人男摧,你說我怎么就攤上這事∫氪颍” “怎么了耗拓?”我有些...
    開封第一講書人閱讀 165,345評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長奏司。 經(jīng)常有香客問我乔询,道長,這世上最難降的妖魔是什么韵洋? 我笑而不...
    開封第一講書人閱讀 58,851評(píng)論 1 295
  • 正文 為了忘掉前任哥谷,我火速辦了婚禮,結(jié)果婚禮上麻献,老公的妹妹穿的比我還像新娘们妥。我一直安慰自己,他們只是感情好勉吻,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評(píng)論 6 392
  • 文/花漫 我一把揭開白布监婶。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪惑惶。 梳的紋絲不亂的頭發(fā)上煮盼,一...
    開封第一講書人閱讀 51,688評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音带污,去河邊找鬼僵控。 笑死,一個(gè)胖子當(dāng)著我的面吹牛鱼冀,可吹牛的內(nèi)容都是我干的报破。 我是一名探鬼主播,決...
    沈念sama閱讀 40,414評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼千绪,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼充易!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起荸型,我...
    開封第一講書人閱讀 39,319評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤盹靴,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后瑞妇,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體稿静,經(jīng)...
    沈念sama閱讀 45,775評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年辕狰,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了自赔。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,096評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡柳琢,死狀恐怖绍妨,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情柬脸,我是刑警寧澤他去,帶...
    沈念sama閱讀 35,789評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站倒堕,受9級(jí)特大地震影響灾测,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜垦巴,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評(píng)論 3 331
  • 文/蒙蒙 一媳搪、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧骤宣,春花似錦秦爆、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽爸吮。三九已至,卻和暖如春望门,著一層夾襖步出監(jiān)牢的瞬間形娇,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評(píng)論 1 271
  • 我被黑心中介騙來泰國打工筹误, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留桐早,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,308評(píng)論 3 372
  • 正文 我出身青樓厨剪,卻偏偏與公主長得像哄酝,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子丽惶,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容