Human-in-the-Loop Person Re-identification

最近在看person re-identification相關(guān)的paper沙峻,之后應(yīng)該會(huì)有一系列以eccv 2016 person re-identification為主題相關(guān)的筆記诽俯。

這是第一篇悟民。

主要思想之一(HVIL)

假設(shè)有一組probe set鼠哥,有一組gallery set净捅,HVIL(human verification incremental learning) 的主要做法就是瓮栗,每給出一張probe袍榆,用模型對gallery set里的圖片進(jìn)行rank,然后把rank list給user看溉痢,user從中找出true match(就是和probe屬于同一個(gè)人的照片)并且給出以下三個(gè)值中的一個(gè){true match, similar, dissimilar} ,true match 代表模型給出的top rank 和 probe是匹配的(屬于同一個(gè)人)僻造,similar 代表模型給出的top rank 和probe有點(diǎn)像逛拱,dissimilar代表一點(diǎn)也不像蚕脏。user給出這兩個(gè)反饋信息后公浪,model就進(jìn)行參數(shù)更新劳曹,并online地再次給出rank list,user再給出上述的兩個(gè)反饋信息蔬螟。如此往復(fù),直到user給出的第二個(gè)信息是true match 或者 循環(huán)的次數(shù)達(dá)到了預(yù)先設(shè)定的次數(shù)(這篇論文中設(shè)定3次)汽畴。對每個(gè)probe都進(jìn)行這樣的操作旧巾。這樣訓(xùn)練完以后再進(jìn)行testing。

這樣做有這樣幾個(gè)好處:

  • 傳統(tǒng)的人工標(biāo)注忍些,需要user在看到一個(gè)probe后在所有g(shù)allery中尋找匹配的identity鲁猩,gallery分布比較隨機(jī),你說不定翻遍整個(gè)gallery set才找到true match罢坝。這個(gè)方法的話廓握,隨著模型的迭代修正,會(huì)把gallery set 按照rank score排列嘁酿,這樣越到后面隙券,就越可能在很靠前的位置找到true match,減輕勞動(dòng)力闹司。
  • 除了像傳統(tǒng)標(biāo)注方法給出true match以外娱仔,還給出{true match, similar, dissimilar}三個(gè)值中的一個(gè),有利于模型的自我修正游桩。
  • 現(xiàn)在reID存在的一個(gè)問題就是牲迫,訓(xùn)練數(shù)據(jù)少,但是待測試的數(shù)據(jù)太多借卧,在實(shí)際場景是更是如此盹憎,你想一個(gè)24小時(shí)工作的攝像頭一天能產(chǎn)生多少數(shù)據(jù)。铐刘。陪每。所以傳統(tǒng)的方法,即在訓(xùn)練數(shù)據(jù)上訓(xùn)練滨达,再把訓(xùn)練好的模型做testing奶稠,是unscalable的,但是這個(gè)方法捡遍,不需要傳統(tǒng)的預(yù)標(biāo)注的數(shù)據(jù)锌订,如果testing數(shù)據(jù)變多了,那么再在原來的基礎(chǔ)上user再繼續(xù)訓(xùn)練模型就好了画株。

具體做法

計(jì)算error

前面已經(jīng)說了辆飘,user給出兩個(gè)反饋信息啦辐,一個(gè)是true match ,另一個(gè)是{true match, similar, dissimilar}三個(gè)值中的一個(gè)蜈项,然后就要算模型的error了芹关,


1式中,下面這一項(xiàng)代表模型給出的rank scores紧卒,其中x^p是給定的probe的特征(可以是color LBP等)侥衬,x^g是gallery set 中的對給定probe的true match的特征。


2式中跑芳,I(·)是指示函數(shù)轴总,意思就是·如果成立,那函數(shù)值為1博个,·如果不成立怀樟,那函數(shù)值為0。1式等號右邊的意思就是把所有rank score高于true match的score的數(shù)量統(tǒng)計(jì)出來(理想狀況下盆佣,這些gallery的分?jǐn)?shù)不應(yīng)該高于true match)(注:后來想到往堡,最后對結(jié)果進(jìn)行評價(jià)的時(shí)候,有個(gè)前5hit 前10hit 前20hit之類的共耍,所以這里應(yīng)該是虑灰,如果正確答案在分?jǐn)?shù)top5 top10 top20的list內(nèi),就算true match)

3式中征堪,y就是{true match, similar, dissimilar}三個(gè)值中的一個(gè)瘩缆,如果y是true match或者 similar,loss function就是上面那個(gè)式子佃蚜,如果y是dissimilar庸娱,那就用下面那個(gè)式子。此外谐算,如果y是true match熟尉, 那么αi取1/i(比較陡峭),如果y是similar或者dissimilar洲脂,那么αi取1/(ng - 1)(比較平緩)斤儿,這樣做可以讓true match在rank list 中迅速上升,讓negatives緩慢下降恐锦。雖然我不懂為啥要這樣干往果,但是作者說這樣做的實(shí)際表現(xiàn)很好,姑且就信了吧一铅。

更新模型參數(shù)

根據(jù)user的反饋得到error 后陕贮,就要實(shí)時(shí)更新模型參數(shù)了

f(·)是負(fù)的Mahalanobis distance metric,這個(gè)函數(shù)值越大潘飘,表示probe和gallery越接近肮之。越小表示越遠(yuǎn)掉缺,所以其實(shí)就是我上面說的rank score。

5式是object function戈擒,其中ΔF是Bregman divergence measure眶明,你也可以看做是一種距離的度量。你可以把5式理解為筐高,當(dāng)很多次循環(huán)后搜囱,如果M和Mt-1已經(jīng)近似相同了(收斂),那么訓(xùn)練目標(biāo)也就達(dá)到了凯傲。其實(shí)5式后面那個(gè)我也不是很理解犬辰,這里把原文摘錄如下,有誰理解的可以交流一下:


(注:我已經(jīng)搞懂上面的意思了冰单,我上面說的那段話有錯(cuò)誤,5式才是我們的目標(biāo)函數(shù)灸促,5式的目的是為了平穩(wěn)的更新M诫欠,5式左側(cè)的三角形式子是Bregman divergence measure,你也可以看做是一種距離的度量浴栽,右式是loss荒叼,左側(cè)式子的意思是為了讓M的更新速度小一點(diǎn),右式的意思是要讓loss向著變小的方向移動(dòng)典鸡,兩者相互調(diào)節(jié))

但是按照3式中的loss function被廓,這個(gè)Mt是離散的,所以不可微萝玷,作者做了一些處理嫁乘,使它變得可微(用一個(gè)連續(xù)的上界來估計(jì)loss),如6式:

其中:

上面那部分我沒有細(xì)讀球碉,所以直接摘錄了蜓斧。
后面作者為了加速整個(gè)參數(shù)更新,又對6式做了處理睁冬,這里不摘錄了挎春。

整個(gè)流程總結(jié)如下

主要思想之二 (RMEL)

上面的訓(xùn)練過程中產(chǎn)生了一系列副產(chǎn)品,就是每次得到的模型Mt(隨著t變化豆拨,有好幾個(gè)從弱到強(qiáng)的模型)直奋。給出一個(gè)probe-gallery pair ,作者把這幾個(gè)模型給出的結(jié)果ensemble起來施禾,作為probe和gallery之間的距離:

最終的ranking function設(shè)計(jì)如下:

所以還要學(xué)習(xí)W這個(gè)參數(shù)矩陣脚线。
學(xué)習(xí)的目標(biāo)函數(shù)如下:

F星號是理想的W,F(xiàn)ens是現(xiàn)有的W拾积,學(xué)習(xí)的目標(biāo)就是最小化兩者的差距(理想的W殉挽,在i和j相同時(shí)應(yīng)該讓fens為0丰涉,在i和j不同時(shí)讓f^ens為-1,所以這個(gè)F星號是可以得到的斯碌。)一死。13式右邊最后那一項(xiàng)也是一個(gè)正則項(xiàng)這個(gè)R(w)可以取很多類型,比如L1 L2 或者matrix trace傻唾,作者在這里取成這樣:

這么做的目的是為了重重懲罰(severe penalties)下面這種情況:這個(gè)pair是match的投慈,但是分?jǐn)?shù)很低。f值是負(fù)的(從12式可以看出)冠骄,如果分?jǐn)?shù)很低伪煤,那么f值在取相反數(shù),那這個(gè)R值就很大凛辣,懲罰就大抱既。

13式是個(gè)凸函數(shù),可以比較輕易的做優(yōu)化扁誓。這一步里訓(xùn)練數(shù)據(jù)用的是之前人工參與的時(shí)候的true pairs防泵。

結(jié)合上述兩個(gè)思想就能把模型訓(xùn)練出來。

實(shí)驗(yàn)結(jié)果

以上蝗敢。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末捷泞,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子寿谴,更是在濱河造成了極大的恐慌锁右,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,907評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件讶泰,死亡現(xiàn)場離奇詭異咏瑟,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)峻厚,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,987評論 3 395
  • 文/潘曉璐 我一進(jìn)店門响蕴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人惠桃,你說我怎么就攤上這事浦夷。” “怎么了辜王?”我有些...
    開封第一講書人閱讀 164,298評論 0 354
  • 文/不壞的土叔 我叫張陵劈狐,是天一觀的道長。 經(jīng)常有香客問我呐馆,道長肥缔,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,586評論 1 293
  • 正文 為了忘掉前任汹来,我火速辦了婚禮续膳,結(jié)果婚禮上改艇,老公的妹妹穿的比我還像新娘。我一直安慰自己坟岔,他們只是感情好谒兄,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,633評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著社付,像睡著了一般承疲。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上鸥咖,一...
    開封第一講書人閱讀 51,488評論 1 302
  • 那天燕鸽,我揣著相機(jī)與錄音,去河邊找鬼啼辣。 笑死啊研,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的鸥拧。 我是一名探鬼主播悲伶,決...
    沈念sama閱讀 40,275評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼住涉!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起钠绍,我...
    開封第一講書人閱讀 39,176評論 0 276
  • 序言:老撾萬榮一對情侶失蹤舆声,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后柳爽,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體媳握,經(jīng)...
    沈念sama閱讀 45,619評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,819評論 3 336
  • 正文 我和宋清朗相戀三年磷脯,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蛾找。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,932評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡赵誓,死狀恐怖打毛,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情俩功,我是刑警寧澤幻枉,帶...
    沈念sama閱讀 35,655評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站诡蜓,受9級特大地震影響熬甫,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蔓罚,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,265評論 3 329
  • 文/蒙蒙 一椿肩、第九天 我趴在偏房一處隱蔽的房頂上張望瞻颂。 院中可真熱鬧,春花似錦郑象、人聲如沸贡这。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,871評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽藕坯。三九已至,卻和暖如春噪沙,著一層夾襖步出監(jiān)牢的瞬間炼彪,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,994評論 1 269
  • 我被黑心中介騙來泰國打工正歼, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留辐马,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,095評論 3 370
  • 正文 我出身青樓局义,卻偏偏與公主長得像喜爷,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子萄唇,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,884評論 2 354

推薦閱讀更多精彩內(nèi)容