introduction
用dl的方法去預測人的attribute挣饥,這是一種local的方法,在這篇文章中是對global方法的一種補充(兩者同時作用)狠裹。以下圖為例调违,一個只捕獲global特征的reID system是無法辨別下面的人的,但是人眼可以,因為人眼在無法從全局信息分辨的時候铺然,還能更進一步的仔細觀察特征俗孝,即attribute。
這篇文章和以往用attribute來做reID的方法不同之處在于魄健,以往的文章用的都是image pair 或者是 triplet (loss)驹针,原因是以往的dataset對于每一個ID只提供一對圖片,而現(xiàn)在的dataset能提供更多的訓練樣本诀艰,所以用classification(loss)的方法會更好一些。
然后我們需要理解兩個概念饮六,一個是ID-level attributes其垄,意思是屬于某個人的具體的特征,比如性別卤橄,帶沒帶帽子等绿满,另一個是Instance-level attribute,比如在打電話窟扑,在騎自行車等喇颁,這篇文章關注的是前者。
作者提出一個網(wǎng)絡結構(w attribute-person recognition (APR) network)嚎货,類似于我前一篇解讀的paper橘霎,分成兩個branch,一個branch就是提取全局特征做reID殖属,另一個branch用于提取attribute信息姐叁。結構圖如下
此外,作者還做了件好事洗显,就是因為他們要用attribute信息外潜,所以他們?nèi)斯俗⒘艘徊糠中畔ⅰ?/p>
related work
基于CNN的前人的工作分成兩種,一種是deep metric learning挠唆, 另一種是deep representation learning处窥,前者在訓練小數(shù)據(jù)集上有優(yōu)勢。但是后者目前更受歡迎玄组。本文的工作是基于后者的滔驾。