從人臉識(shí)別到行人重識(shí)別咖刃,下一個(gè)風(fēng)口

姓名:榮皓宇

學(xué)號(hào):17101223406

轉(zhuǎn)載自開發(fā)者頭條: https://mp.weixin.qq.com/s/f0a5MZn9ljf-0GMdb8ktZA泳炉,有部分刪改

【嵌牛導(dǎo)讀】:人臉識(shí)別技術(shù)的應(yīng)用已經(jīng)逐步滲透各行各業(yè),比如你的iphone X等嚎杨。但人臉識(shí)別已經(jīng)非常成熟了花鹅,現(xiàn)在讓我們介紹下下個(gè)方向:行人重識(shí)別

【嵌牛鼻子】:行人重識(shí)別應(yīng)用,人臉識(shí)別枫浙,區(qū)別刨肃,用途,解決方案

【嵌牛提問】:行人重識(shí)別如何識(shí)別一個(gè)極小的(32x32)圖中箩帚、可能是側(cè)臉甚至后腦勺的人呢真友?

【嵌牛正文】:

人臉識(shí)別在LFW超越人的識(shí)別能力之后,就很少有重大的突破了紧帕,逐漸轉(zhuǎn)向視頻中人臉識(shí)別或人臉屬性學(xué)習(xí)等方向盔然。CV頂級(jí)會(huì)議的接受論文量也出現(xiàn)了逐漸平穩(wěn)的趨勢(shì)。

而行人重識(shí)別(Person re-identification)也稱行人再識(shí)別是嗜,是利用計(jì)算機(jī)視覺技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù)轻纪。廣泛被認(rèn)為是一個(gè)圖像檢索的子問題。 給定一個(gè)監(jiān)控行人圖像叠纷,檢索跨設(shè)備下的該行人圖像。旨在彌補(bǔ)目前固定的攝像頭的視覺局限潦嘶,并可與行人檢測(cè)/行人跟蹤技術(shù)相結(jié)合 涩嚣,可廣泛應(yīng)用于智能視頻監(jiān)控崇众、智能安保等領(lǐng)域。

行人重識(shí)別為國內(nèi)現(xiàn)在主要的研究方向之一航厚,投稿量則在逐年遞增顷歌。國內(nèi)主要為 清華大學(xué),北京大學(xué)幔睬,復(fù)旦大學(xué)眯漩,大工,中山大學(xué)麻顶,港中文赦抖,華科,西交辅肾,中科院队萤,廈大等研究機(jī)構(gòu);國外為 悉尼科技矫钓,QMUL和UTSA等要尔。行人重識(shí)別CV頂級(jí)會(huì)議的接受論文量穩(wěn)步提升。

1新娜、首先讓我們從頂級(jí)會(huì)議錄取量的角度分析

人臉識(shí)別論文數(shù)量 (按關(guān)鍵字檢索 “face recognition“,"face verification")

CVPR2013: 9

ICCV2013: 11

CVPR2014: 7

CVPR2015: 8

ICCV2015: 2

CVPR2016: 5

CVPR2017: 6

ICCV2017: 8

行人重識(shí)別論文數(shù)量 (按關(guān)鍵字檢索 “person re-identification”,"person search","person retrieval"赵辕,"pedestrian retrieval")

CVPR2013: 1

ICCV2013: 3

CVPR2014: 3

CVPR2015: 7

ICCV2015: 8

CVPR2016: 11

CVPR2017: 14

ICCV2017: 16

2、行人重識(shí)別 和 人臉識(shí)別 的異同

行人重識(shí)別 是用一個(gè)攝像頭下的照片 去認(rèn)其他攝像頭下是否再次出現(xiàn)了這個(gè)人概龄。需處理攝像頭的viewpoint變化还惠,行人的姿態(tài)變化等。

人臉識(shí)別 是給定pair旁钧,去識(shí)別是不是同一個(gè)人吸重,或者找到照片庫中見過的人。

行人和人臉一樣具有結(jié)構(gòu)歪今,但行人結(jié)構(gòu)更復(fù)雜一些嚎幸,部件更多,不容易對(duì)齊寄猩。

大型行人數(shù)據(jù)集難以獲得嫉晶,不像人臉可以扒名人。現(xiàn)有行人重識(shí)別數(shù)據(jù)集(DukeMTMC-reID田篇,CUHK03替废,Market-1501等等)都是在校園中實(shí)際用攝像頭錄的。而早期的小數(shù)據(jù)集(Viper等)已無法提供全面評(píng)估泊柬,逐漸少用椎镣。

行人重識(shí)別落地的產(chǎn)品很少, 而人臉識(shí)別的大量應(yīng)用已經(jīng)落地 兽赁?

之前學(xué)界研究的少 多攝像頭/跨攝像頭問題状答。

以上是造成行人重識(shí)別 在學(xué)界火的原因吧冷守。

3、行人重識(shí)別常用 Large-scale 數(shù)據(jù)集

DukeMTMC-reID

該數(shù)據(jù)集在杜克大學(xué)內(nèi)采集惊科,圖像來自8個(gè)不同攝像頭拍摇。該數(shù)據(jù)集提供訓(xùn)練集和測(cè)試集。 訓(xùn)練集包含16,522張圖像馆截,測(cè)試集包含 17,661 張圖像充活。訓(xùn)練數(shù)據(jù)中一共有702人,平均每類(每個(gè)人)有23.5 張訓(xùn)練數(shù)據(jù)蜡娶。是目前最大的行人重識(shí)別數(shù)據(jù)集混卵,并且提供了行人屬性(性別/長短袖/是否背包等)的標(biāo)注。

Market-1501

該數(shù)據(jù)集在清華大學(xué)校園中采集翎蹈,圖像來自6個(gè)不同的攝像頭淮菠,其中有一個(gè)攝像頭為低像素。同時(shí)該數(shù)據(jù)集提供訓(xùn)練集和測(cè)試集荤堪。 訓(xùn)練集包含12,936張圖像合陵,測(cè)試集包含19,732 張圖像。圖像由檢測(cè)器自動(dòng)檢測(cè)并切割澄阳,包含一些檢測(cè)誤差(接近實(shí)際使用情況)拥知。訓(xùn)練數(shù)據(jù)中一共有751人,測(cè)試集中有750人碎赢。所以在訓(xùn)練集中低剔,平均每類(每個(gè)人)有17.2張訓(xùn)練數(shù)據(jù)。

CUHK03

該數(shù)據(jù)集在香港中文大學(xué)內(nèi)采集肮塞,圖像來自2個(gè)不同攝像頭襟齿。該數(shù)據(jù)集提供 機(jī)器檢測(cè)和手工檢測(cè)兩個(gè)數(shù)據(jù)集。 其中檢測(cè)數(shù)據(jù)集包含一些檢測(cè)誤差枕赵,更接近實(shí)際情況猜欺。平均每個(gè)人有9.6張訓(xùn)練數(shù)據(jù)。

4拷窜、未來可能拓展的研究課題

Transfer learning开皿。 在LFW上學(xué)好的人臉模型,在實(shí)際中可能不work篮昧。在行人重識(shí)別也有同樣的問題赋荆。 如研究在 數(shù)據(jù)集 Market-1501(夏季清華國人)上訓(xùn)練好的模型,怎么應(yīng)用到另一個(gè)數(shù)據(jù)集 DukeMTMC-reID(冬季杜克老外)

像人臉一樣懊昨。 往屬性學(xué)習(xí)/視頻base的行人重識(shí)別轉(zhuǎn)窄潭。

做更大更難的檢索庫,比如Market-1501 + 500K(更多干擾的候選行人)酵颁。

語言檢索行人嫉你。通過自然語言的描述來找人信认。


行人重識(shí)別:從哈利波特地圖說起

一、本文的目的是提供一個(gè)行人重識(shí)別的簡要概況均抽。

為了方便/直觀的理解這個(gè)問題,我們先來說兩則相關(guān)的故事其掂。一則闡明重識(shí)別問題的實(shí)際意義油挥,一則故事說明重識(shí)別問題的難點(diǎn)。

重識(shí)別的應(yīng)用:哈利·波特 在《阿茲卡班囚徒》中使用 實(shí)點(diǎn)圖 (Marauder’s Map) 實(shí)時(shí)追蹤并識(shí)別追蹤人 (顯示人名)款熬。將這個(gè)應(yīng)用轉(zhuǎn)化一下深寥,試想:如果在迪斯尼樂園/機(jī)場(chǎng)/大學(xué)校園里和孩子走散了,除了廣播“xx小朋友你的家長在廣播室等你”的被動(dòng)方式贤牛。我們可以翻開 實(shí)點(diǎn)圖就找到熊孩子惋鹅。而實(shí)點(diǎn)圖就可以通過重識(shí)別來實(shí)現(xiàn):主動(dòng)輸入小朋友的照片,檢索多個(gè)不同位置的攝像頭下的當(dāng)前幀殉簸,找到熊孩子的出現(xiàn)攝像頭闰集。最后聯(lián)系攝像頭的位置,就可以定位孩子了般卑。這個(gè)應(yīng)用同樣也可以用來找小偷/保護(hù)vip等等武鲁。

重識(shí)別的難點(diǎn):荷馬史詩 (Odyssey iv:412),Mennelaus 被告知蝠检,如果想要眾神息怒并平安回家沐鼠,就要在特洛伊戰(zhàn)爭的回家路上抓到 Proteus,讓他告訴自己躲避的方法叹谁。雖然Proteus變成了獅子饲梭,巨蛇,豹焰檩,甚至水和大樹憔涉,Mennelaus最終還是在海邊的海豹群中抓住了他,并知曉了自己平安回家的方法锅尘。這大概是最早的重識(shí)別的成功案例监氢。對(duì)照西游記的話,那大概就是大師兄三打白骨精的故事了藤违。重識(shí)別的難點(diǎn)在于浪腐,我們沒有大師兄的火眼金睛。多個(gè)攝像頭下拍攝行人的角度不同顿乒,圖像中的行人可能72變议街。所以要正確判斷的話,就要找到行人上的局部不變的part(比如:衣服顏色璧榄,衣服紋理特漩,手提包吧雹,背包等等)。在計(jì)算機(jī)視覺中涂身,常用的特征就有顏色直方圖等等雄卷。

(DukeMTMC-reID 數(shù)據(jù)集的retrieval demo)

二. 為了更好的理解這個(gè)問題,我們?cè)偎伎紟讉€(gè)補(bǔ)充問題:

1. 能不能用人臉識(shí)別做重識(shí)別蛤售?

理論上是可以的丁鹉。但是有兩個(gè)原因?qū)е氯四樧R(shí)別較難應(yīng)用:首先,廣泛存在后腦勺和側(cè)臉的情況悴能,做正臉的人臉識(shí)別難揣钦。其次,攝像頭拍攝的像素可能不高漠酿,尤其是遠(yuǎn)景攝像頭里面人臉截出來很可能都沒有32x32的像素冯凹。所以人臉識(shí)別在實(shí)際的重識(shí)別應(yīng)用中很可能有限。

2. 有些人靠衣服的顏色就可以判斷出來了炒嘲,還需要行人重識(shí)別么宇姚?

衣服顏色確實(shí)是行人重識(shí)別 做出判斷一個(gè)重要因素,但光靠顏色是不足的摸吠。首先空凸,攝像頭之間是有色差,并且會(huì)有光照的影響寸痢。其次呀洲,有撞衫(顏色相似)的人怎么辦,要找細(xì)節(jié)啼止,但比如顏色直方圖這種統(tǒng)計(jì)的特征就把細(xì)節(jié)給忽略了道逗。在多個(gè)數(shù)據(jù)集上的測(cè)試表明,光用顏色特征是難以達(dá)到50%的top1正確率的献烦。

3. 使用圖像檢索的指標(biāo)來衡量行人重識(shí)別的結(jié)果是否合適滓窍?

在早期,行人重識(shí)別數(shù)據(jù)集是由兩個(gè)攝像頭采集的比如viper巩那,每個(gè)query只有一個(gè)正確的retrieval目標(biāo)吏夯。所以往往使用top1比較。但在近期即横,隨著大數(shù)據(jù)集的提出噪生,數(shù)據(jù)集中往往包含多個(gè)攝像頭的多個(gè)正確目標(biāo)。光使用top1的話东囚,不能反應(yīng)模型的真實(shí)能力跺嗽。所以類似圖像檢索,重識(shí)別加入了mAP作為衡量標(biāo)準(zhǔn),將top2,top3...topn都考慮進(jìn)去桨嫁。

4. 測(cè)試方式

主要有兩種方案:a.測(cè)試的輸入是一對(duì)行人植兰,輸出為這對(duì)行人的相似度,然后再按相似度排序璃吧;b.輸入單個(gè)人楣导,提取特征,再計(jì)算與其他人的歐式距離畜挨,然后再按距離排序爷辙。

第一種方案的優(yōu)點(diǎn)是,判斷兩個(gè)人是不是一個(gè)人朦促,簡單的二分類(是/否)。但缺點(diǎn)是如果我們搜索庫中有m張圖片栓始,那么與目標(biāo)圖片組成m對(duì)圖片對(duì)务冕。每一對(duì)都要進(jìn)一次模型,估算相似度幻赚,這極大的增加了測(cè)試的時(shí)間禀忆。如果我們有n個(gè)query,那么我們要計(jì)算nm次相似度(而m往往很大)落恼。另一種方案是箩退,預(yù)先提取行人的特征,我們只要預(yù)先提好n+m次特征佳谦。之后只要比較就好了戴涝,比較特征可以簡單的用矩陣乘法實(shí)現(xiàn)。

目前兩種方案都有在用钻蔑,但是后一種更接近實(shí)際中圖像搜索的要求啥刻,用特征來快速檢索。

三. 科研中的方案

概括得不全咪笑,比較直接和簡要的想法有以下兩種(主要在神經(jīng)網(wǎng)絡(luò)上實(shí)現(xiàn)):

1. Part匹配:一部分一部分來比較可帽。

a.常見方案是水平切條,就是將圖像切為幾個(gè)水平的條窗怒。由于人體身材往往差不多映跟,所以可以用簡單的水平條來做一一比較 [1,2,3,4]。

b.在領(lǐng)域中做匹配扬虚,采用的是一個(gè)正方形的領(lǐng)域 [6]努隙。

c.另一個(gè)較新的方案是先在人體上檢測(cè)部件(手,腿孔轴,軀干等等)再進(jìn)行匹配剃法,這樣的話可以減少位置的誤差,但可能引入檢測(cè)部件的誤差 [7,8]。

d. 類似LSTM的attention匹配贷洲,但必須pair輸入收厨,測(cè)試時(shí)間較長。[5,10]

2.Loss設(shè)計(jì):常見的幾種學(xué)習(xí)特征表達(dá)的loss

a. identification loss 直接拿身份label做多類分類 [9]

b.verification loss [2,3,5,6] (主要是contrastive loss优构。[3, 6]中采用的是二分類loss)

c. identification loss + verification loss [11,12]

d. triplet loss [10,13,14]

e. 加入輔助任務(wù) 比如使用attribute等等 [15],

f. 數(shù)據(jù)增強(qiáng) 混合多數(shù)據(jù)集訓(xùn)練 [16] 诵叁,加入訓(xùn)練集上GAN生成的數(shù)據(jù) [17].

目前有一些公開的代碼,可詳見之前的知乎回答:有哪些行人重識(shí)別公開代碼?做了一些匯總钦椭。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末拧额,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子彪腔,更是在濱河造成了極大的恐慌侥锦,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,402評(píng)論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件德挣,死亡現(xiàn)場(chǎng)離奇詭異恭垦,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)格嗅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門番挺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人屯掖,你說我怎么就攤上這事玄柏。” “怎么了贴铜?”我有些...
    開封第一講書人閱讀 162,483評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵粪摘,是天一觀的道長。 經(jīng)常有香客問我绍坝,道長赶熟,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,165評(píng)論 1 292
  • 正文 為了忘掉前任陷嘴,我火速辦了婚禮映砖,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘灾挨。我一直安慰自己邑退,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,176評(píng)論 6 388
  • 文/花漫 我一把揭開白布劳澄。 她就那樣靜靜地躺著地技,像睡著了一般。 火紅的嫁衣襯著肌膚如雪秒拔。 梳的紋絲不亂的頭發(fā)上莫矗,一...
    開封第一講書人閱讀 51,146評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼作谚。 笑死三娩,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的妹懒。 我是一名探鬼主播雀监,決...
    沈念sama閱讀 40,032評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼眨唬!你這毒婦竟也來了会前?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,896評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤匾竿,失蹤者是張志新(化名)和其女友劉穎瓦宜,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體岭妖,經(jīng)...
    沈念sama閱讀 45,311評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡歉提,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,536評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了区转。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,696評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡版扩,死狀恐怖废离,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情礁芦,我是刑警寧澤蜻韭,帶...
    沈念sama閱讀 35,413評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站柿扣,受9級(jí)特大地震影響肖方,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜未状,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,008評(píng)論 3 325
  • 文/蒙蒙 一俯画、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧司草,春花似錦艰垂、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至搔课,卻和暖如春胰柑,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評(píng)論 1 269
  • 我被黑心中介騙來泰國打工柬讨, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留崩瓤,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,698評(píng)論 2 368
  • 正文 我出身青樓姐浮,卻偏偏與公主長得像谷遂,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子卖鲤,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,592評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 行人重識(shí)別綜述 一般來說肾扰,行人重識(shí)別屬于各種ID識(shí)別方法的一個(gè)子類。我們姑且將ID識(shí)別定義為通過可測(cè)量的人類生物特...
    fade2black閱讀 16,240評(píng)論 0 11
  • 紀(jì)錄自己對(duì)于畢設(shè)的一些思考蛋逾,或許能有助于最后論文的書寫集晚。 研究背景 隨著科技的發(fā)展以及社會(huì)的需要,越來越多的大型攝...
    跑者小越閱讀 8,503評(píng)論 0 6
  • 圖像識(shí)別主要用到了兩個(gè)第三方的框架:OpenCV和TesseractOCR区匣,OpenCV用來做圖像處理偷拔,定位到身份...
    方弟閱讀 11,573評(píng)論 9 52
  • 。亏钩。莲绰。。
    星羅棋布藝術(shù)空間閱讀 603評(píng)論 0 0
  • 7月姑丑,我認(rèn)識(shí)了一個(gè)與我截然不同的人蛤签,我這樣評(píng)價(jià)他:頗具吸引力,溫柔且有趣栅哀。我明白這種吸引力源自于哪兒...
    雲(yún)彩山閱讀 248評(píng)論 0 1