FD-GAN: Pose-guided Feature Distilling GAN forRobust Person Re-identification(NIPS 2018)

設(shè)計了特征提取生成對抗網(wǎng)絡(luò)(FD-GAN)用于學(xué)習(xí)與身份相關(guān)和姿勢無關(guān)的表示，即在設(shè)計網(wǎng)絡(luò)使得在行人重識別的時候不去考慮姿勢妙痹。

Introduction

行人重識別(reID)目的是在多個攝像機上匹配具有相同身份的行人圖像频轿。姿勢變化潜沦，模糊和遮擋是行人重識別的一個重大挑戰(zhàn)洪乍。有使用GAN進行行人重識別算法的研究。zheng 等人提出半監(jiān)督結(jié)構(gòu)，利用標記平滑正則化生成圖像党窜，用于異常值正則化。PTGAN被提出用于彌補不同數(shù)據(jù)集之間的域差距借宵。GAN還能用于表示學(xué)習(xí)幌衣。

提出的FD-GAN(特征提煉生成對抗網(wǎng)絡(luò))嘗試在姿勢發(fā)生變化的同時保持身份信息的一致性。

圖1

特征學(xué)習(xí)過程中應(yīng)用連體結(jié)構(gòu)壤玫，每個分支都包含一個編碼器和圖像生成器豁护，圖像編碼器嵌入了輸入圖像中的人的特征。圖像生成器通過編碼生成以姿勢信息和輸入人物特征為條件的新的圖像欲间〕铮框架中繼承了多個鑒別器，用于區(qū)分兩個分支生成的圖像之間的分支間和分支內(nèi)的關(guān)系猎贴。

所提出的身份鑒別器班缎，姿勢鑒別器和驗證分類器以及重建損失和新穎的相同姿勢損失共同規(guī)范了用于實現(xiàn)健壯的人reID的特征學(xué)習(xí)過程。

總的貢獻：

提出新的FD-GAN她渴，用于姿勢發(fā)生變化的行人重識別达址。在推理期間不在需要額外的輔助姿勢信息或增加計算復(fù)雜度。
人圖像生成作為輔助任務(wù)趁耗，但是仍然生成了質(zhì)量比較好的圖像沉唠。

Feature Distilling Generative Adversarial Network

特征提取生成性對抗網(wǎng)絡(luò)(FDGAN)旨在學(xué)習(xí)和身份相關(guān)，姿勢無關(guān)的任務(wù)表示苛败。

方法總體框架如下所示：

圖2

所提出的FD-GAN采用了暹羅結(jié)構(gòu)(連體結(jié)構(gòu))满葛，包括圖像編碼器E，圖像生成器G罢屈，身份驗證分類器V和兩個鑒別器(身份鑒別器和姿勢鑒別器)嘀韧。網(wǎng)絡(luò)的每個分支將人的圖像和生成圖像的姿勢標記圖作為輸入。圖像編碼器首先將每個分支的輸入的任務(wù)圖像轉(zhuǎn)換為特征表示儡遮，身份驗證分類器用于監(jiān)督行人reID的特征學(xué)習(xí)乳蛾。圖像生成器G通過給定輸出圖像姿勢和輸入圖像生成使得學(xué)習(xí)特征魯棒并且和姿勢無關(guān)的圖像。身份鑒別器 $D_{id}$ 和姿勢鑒別器 $D_{pd}$ 用于規(guī)范圖像生成過程鄙币，促進生成器生成圖像肃叶。這兩個判別器都是條件判別器，用于根據(jù)輸入標識符姿勢對輸入圖像是真是假進行分類十嘿。同時鼓勵圖像生成器和圖像編碼器共同用偽造的圖像欺騙鑒別器因惭。還增加了同一個人的不同圖像生成姿勢應(yīng)當(dāng)一致的損失(圖中的Same-pose loss)。整個框架是端到端的方式進行訓(xùn)練绩衷。在推斷階段蹦魔，僅使用了圖像編碼器沒有使用輔助姿勢信息激率。

圖3

以上所提到的結(jié)構(gòu)如上圖所示。

Image encoder and image generator

圖像編碼器和圖像生成器的結(jié)構(gòu)如上圖中a所示勿决，給定一個輸入圖像乒躺，圖像編碼器利用ResNet-50將其輸入圖像編碼為2048維的特征向量。圖像生成器將編碼的人物特征和目標姿勢圖作為輸入低缩，旨在生成目標姿勢指定的同一人的另一幅圖像嘉冒。然后將視覺特征，目標姿勢特征和標準高斯分布采樣的附加的256維噪聲矢量連接并輸入到一系列采樣快中輸出生成的人圖像咆繁。

Identity verification classifier

給定來自圖像編碼器的兩個輸入圖像讳推，身份驗證分類器V確定兩個圖像是不是同一個人。結(jié)構(gòu)如上圖中b所示玩般。分類器使用二進制交叉熵損失訓(xùn)練银觅。 $d \ left（x _{1}，x_ {2} \ right）$ 表示sigmoid函數(shù)輸出的可信度分數(shù)坏为。該部分損失函數(shù)為：

$\mathcal { L } _{ v } = - C \log d \left( x_ { 1 } , x _{ 2 } \right) - ( 1 - C ) \left( 1 - \log d \left( x_ { 1 } , x _ { 2 } \right) \right)$

其中的 $C$ 是置信度標簽究驴。

Image generation with identity and pose discriminators

使用生成對抗網(wǎng)絡(luò)規(guī)范圖像編碼器E，使他只學(xué)習(xí)身份相關(guān)的信息久脯。

Identity discriminator $D_{id}$

區(qū)分生成的圖像和同一分支輸入人的圖像是不是屬于同一個人纳胧。身份鑒別器網(wǎng)絡(luò)和上面的身份驗證分類網(wǎng)絡(luò)是相同的镰吆。但是不和圖像編碼器E共享權(quán)重帘撰。

$\mathcal { L } _{ i d } = \max_ { D _{ i d } } \sum_ { k = 1 } ^ { 2 } \left( \mathbb { E }_ { y _{ k } ^ { \prime } \in \mathcal { Y } } \left[ \log D_ { i d } \left( x_{ k } , y_{ k } ^ { \prime } \right) \right] + \mathbb { E }_ { y _{ k } \in \mathcal { Z } } \left[ \log \left( 1 - D_ { i d } \left( x _{ k } , y_ { k } \right) \right) \right] \right)$

Pose discriminator $D_{pd}$

$D_{pd}$ 區(qū)分生成圖片 $y_k$ 和目標姿態(tài)是否匹配。如圖中d所示万皿，使用了PatchGAN的結(jié)構(gòu)摧找。對抗損失如下：

$\mathcal { L } _{ p d } = \max_ { D _{ p d } } \sum_ { k = 1 } ^ { 2 } \left( \mathbb { E } _{ y_ { k } ^ { \prime } \in \mathcal { Y } } \left[ \log D _{ p d } \left( \left[ p , y_ { k } ^ { \prime } \right] \right) \right] + \mathbb { E } _{ y_ { k } \in \mathcal { Z } } \left[ \log \left( 1 - D _{ p d } \left( \left[ p , y_ { k } \right] \right) \right) \right] \right)$

實驗中觀察到，姿態(tài)判別器會出現(xiàn)過擬合姿態(tài)信息牢硅，它會記住特定姿態(tài)和行人外觀之間的相似性蹬耘，因此提出了在線姿勢圖增強方案，在訓(xùn)練期間减余，對于每個姿勢界標综苔，其在一些特定范圍內(nèi)的隨機高斯帶寬獲得其1通道高斯類熱圖。

Reconstruction loss

單獨的鑒別器不能保證產(chǎn)生人類能看懂的圖像位岔，因此引入重建損失如筛，最小化生成圖像和對應(yīng)的真實圖像之間的差距。

$\mathcal { L } _ { r } = \sum _ { k = 1 } ^ { 2 } \frac { 1 } { m n } \left\| y _ { k } - y _ { k } ^ { \prime } \right\| _ { 1 }$

其中 $mn$ 是圖像的像素值抒抬。當(dāng)沒有對應(yīng)的真實圖像的時候杨刨，不適用這個損失。

Same-pose loss

輸入同一個人的兩張不同的圖像應(yīng)該會得到近似相同的外觀擦剑。因此引入這個相同的姿勢損失最小化同一個人的兩個生成圖像和目標姿勢之間的差異妖胀。這也鼓勵了兩個輸入圖像中的學(xué)習(xí)視覺特征僅僅和身份相關(guān)芥颈，忽略其他因素。

$\mathcal { L } _ { s p } = \frac { 1 } { m n } \left\| y _ { 1 } - y _ { 2 } \right\| _ { 1 }$

Over all training objective

$\mathcal { L } = \mathcal { L } _ { v } + \lambda _ { i d } \mathcal { L } _ { i d } + \lambda _ { p d } \mathcal { L } _ { p d } + \lambda _ { r } \mathcal { L } _ { r } + \lambda _ { s p } \mathcal { L } _ { s p }$

Trianing scheme

共分為三個階段赚抡。第一階段預(yù)訓(xùn)練編碼器E和身份驗證分類器V爬坑。預(yù)訓(xùn)練的權(quán)重用于初始化第二階段中的E，V和身份鑒別器 $D_{id}$ 涂臣。第二階段固定E和V妇垢，訓(xùn)練G， $D_{id},D_{pd}$ 肉康。第三階段將整個網(wǎng)絡(luò)以端到端的方式微調(diào)闯估。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市吼和，隨后出現(xiàn)的幾起案子涨薪，更是在濱河造成了極大的恐慌，老刑警劉巖炫乓，帶你破解...
沈念sama閱讀 219,270評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件刚夺，死亡現(xiàn)場離奇詭異，居然都是意外死亡末捣，警方通過查閱死者的電腦和手機侠姑，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,489評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來箩做，“玉大人莽红，你說我怎么就攤上這事“畎睿” “怎么了安吁？”我有些...
開封第一講書人閱讀 165,630評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長燃辖。經(jīng)常有香客問我鬼店，道長，這世上最難降的妖魔是什么黔龟？我笑而不...
開封第一講書人閱讀 58,906評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任妇智，我火速辦了婚禮，結(jié)果婚禮上氏身，老公的妹妹穿的比我還像新娘巍棱。我一直安慰自己，他們只是感情好观谦，可當(dāng)我...
茶點故事閱讀 67,928評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布拉盾。她就那樣靜靜地躺著，像睡著了一般豁状。火紅的嫁衣襯著肌膚如雪捉偏。梳的紋絲不亂的頭發(fā)上倒得，一...
開封第一講書人閱讀 51,718評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音夭禽，去河邊找鬼霞掺。笑死，一個胖子當(dāng)著我的面吹牛讹躯，可吹牛的內(nèi)容都是我干的菩彬。我是一名探鬼主播，決...
沈念sama閱讀 40,442評論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼潮梯，長吁一口氣：“原來是場噩夢啊……” “哼骗灶！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起秉馏，我...
開封第一講書人閱讀 39,345評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤耙旦，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后萝究，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體免都，經(jīng)...
沈念sama閱讀 45,802評論 1贊 317
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,984評論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年帆竹，在試婚紗的時候發(fā)現(xiàn)自己被綠了绕娘。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,117評論 1贊 351
活死人
序言：一個原本活蹦亂跳的男人離奇死亡栽连，死狀恐怖险领，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情升酣，我是刑警寧澤舷暮，帶...
沈念sama閱讀 35,810評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站噩茄，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏复颈。R本人自食惡果不足惜绩聘，卻給世界環(huán)境...
茶點故事閱讀 41,462評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望耗啦。院中可真熱鬧凿菩，春花似錦、人聲如沸帜讲。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,011評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽似将。三九已至获黔，卻和暖如春蚀苛，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背玷氏。一陣腳步聲響...
開封第一講書人閱讀 33,139評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工堵未，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人盏触。一個月前我還...
沈念sama閱讀 48,377評論 3贊 373
代替公主和親
正文我出身青樓渗蟹，卻偏偏與公主長得像，于是被迫代替她去往敵國和親赞辩。傳聞我的和親對象是個殘疾皇子雌芽，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,060評論 2贊 355

FD-GAN: Pose-guided Feature Distilling GAN forRobust Person Re-identification(NIPS 2018)

FD-GAN: Pose-guided Feature Distilling GAN forRobust Person Re-identification(NIPS 2018)

Introduction

Feature Distilling Generative Adversarial Network

Image encoder and image generator

Identity verification classifier

Image generation with identity and pose discriminators

Identity discriminator

Pose discriminator

Reconstruction loss

Same-pose loss

Over all training objective

Trianing scheme

推薦閱讀更多精彩內(nèi)容

Identity discriminator $D_{id}$

Pose discriminator $D_{pd}$