Deep Representation Learning with Part Loss for Person Re-Identification(Part loss)(PDF)
Author:Hantao Yao,?Shiliang Zhang,?Yongdong Zhang,?Jintao Li,?Qi Tian?arXiv2017 (Citations:280)
損失函數(shù):Part Loss
任務(wù)領(lǐng)域:人重識別(Person Re-Identification, ReID)
問題背景:
? ? ? ?現(xiàn)有的人重識別任務(wù)采用分類模型來學(xué)習(xí)表征田藐,但是現(xiàn)有的由分類模型學(xué)習(xí)到的特征表示對于零投學(xué)習(xí)問題如人重識別任務(wù)來說并不是最優(yōu)的罢吃,因?yàn)槿酥刈R別任務(wù)和分類任務(wù)的優(yōu)化目標(biāo)并不是一致的郊供。作者對由深度分類任務(wù)得到的特征進(jìn)行了可視化,發(fā)現(xiàn)可視化特征只關(guān)注人體上身這一身體區(qū)域瞎惫,而忽略了身體的其他部分。然而译株,身體的其他部分瓜喇,如頭部、下半身和腳對于不可見人群的描述也是至關(guān)重要的古戴,忽視這份部分的特征會增加不可見數(shù)據(jù)的表征學(xué)習(xí)風(fēng)險(xiǎn)欠橘。
解決方案:
? ? ? ?本文提出了Part Loss網(wǎng)絡(luò),該網(wǎng)絡(luò)由baseline網(wǎng)絡(luò)和用于計(jì)算Part Loss的延伸網(wǎng)絡(luò)兩部分組成现恼。
1.Baseline Network
? ? ? ?Baseline網(wǎng)絡(luò)與基于分類的卷積神經(jīng)網(wǎng)絡(luò)一致肃续,都是提取圖像的全局特征表示。首先叉袍,利用CNN網(wǎng)絡(luò)提取圖像的特征表示,
然后始锚,利用分類器計(jì)算特征表示的分類得分(即預(yù)測標(biāo)簽),
最后喳逛,利用損失函數(shù)計(jì)算經(jīng)驗(yàn)分類風(fēng)險(xiǎn)瞧捌。
在這一過程中,作者指出:為了提升訓(xùn)練期間特征的判別能力润文,一個(gè)可能的方法是限制分類器的能力姐呐,即弱分類器會促使網(wǎng)絡(luò)學(xué)習(xí)具有更強(qiáng)判別力度的特征表示來減小分類損失。此外典蝌,減小訓(xùn)練集上的經(jīng)驗(yàn)分類風(fēng)險(xiǎn)會產(chǎn)生具有判別力的用于分類可見類的特征表示曙砂,這會使得學(xué)習(xí)到的特征表示僅關(guān)注訓(xùn)練集中具有判別力的部分,如人體的上半身骏掀,而忽視人體的其他部分鸠澈。
2.Part Loss Computation?
? ? ? ?為了提升對不可見數(shù)據(jù)的表征學(xué)習(xí)能力,本文提出了表征學(xué)習(xí)風(fēng)險(xiǎn)截驮,促使網(wǎng)絡(luò)對人體的每個(gè)部分都學(xué)習(xí)具有判別能力的特征表示笑陈。我們將人體分為K個(gè)部分,分別學(xué)習(xí)它們的特征表示葵袭,然后計(jì)算表征學(xué)習(xí)風(fēng)險(xiǎn)涵妥。
? ? ?最終,我們將兩部分損失結(jié)合起來來訓(xùn)練PL-Net 坡锡。