Deep Metric Learning via Lifted Structured Feature Embedding

Deep Metric Learning via Lifted Structured Feature Embedding(PDF)


Author:Hyun Oh Song,?Yu Xiang,?Stefanie Jegelka,?Silvio Savarese CVPR2016?(Citations:1066)

核心思想:

? ? ? ?較早提出的基于對(duì)的損失函數(shù)對(duì)于樣本的利用率太低扁掸,例如說在contrastive loss中,一個(gè)mini-batch size為n的樣本集只能形成n/2個(gè)樣本對(duì)攒砖。那么本文主要解決的就是樣本利用率過低的缺點(diǎn)酌心,將所有樣本之間兩兩配對(duì)筛璧,使樣本對(duì)的數(shù)量提升為(n*(n-1)/2)。

問題引入:

? ? ? ?最近,含有大量類別數(shù)量的極端分類問題最近在學(xué)術(shù)界引起了廣泛的關(guān)注尤揣。在極端分類問題中宙橱,學(xué)習(xí)和推理復(fù)雜度與類別的數(shù)量不再成線性關(guān)系姨俩,其次,每個(gè)類別中的可用樣本數(shù)據(jù)非常少养匈。然而哼勇,現(xiàn)有的方法途徑在網(wǎng)絡(luò)的小批量隨機(jī)梯度下降訓(xùn)練過程中不能完全利用所有的訓(xùn)練樣本。

解決方案:

提升結(jié)構(gòu)化特征嵌入:

? ? ? ?在本文中呕乎,基于訓(xùn)練集中所有的正負(fù)樣本對(duì)提出了結(jié)構(gòu)化損失函數(shù):

圖1 結(jié)構(gòu)化損失函數(shù)

其中积担,\hat{P} 是正樣本對(duì),\hat{N} 是負(fù)樣本對(duì)猬仁,\alpha 是margin帝璧。該函數(shù)會(huì)遍歷所有的正樣本對(duì)(i,j),然后找到距離正樣本對(duì)最近的一個(gè)負(fù)樣本(相當(dāng)于搜索最小的D_{i,k} D_{j,l} 即最難的負(fù)樣本),如果該負(fù)樣本到正樣本的距離大于margin+正樣本對(duì)的距離湿刽,則損失為0的烁,其余情況下則產(chǎn)生損失。

圖2 三種嵌入方式的樣本對(duì)生成過程

? ? ? ?該函數(shù)有兩個(gè)計(jì)算上的挑戰(zhàn):一是該函數(shù)由于含有max函數(shù)诈闺,因此非平滑渴庆;二是函數(shù)的估計(jì)和其子梯度的計(jì)算需要對(duì)所有的樣本對(duì)進(jìn)行多次最小化。為了解決上述兩個(gè)問題,首先襟雷,我們對(duì)函數(shù)的平滑上邊界進(jìn)行優(yōu)化刃滓,其次,采用隨機(jī)方法進(jìn)行處理耸弄。

? ? ? ?給定一個(gè)批量為m的c維嵌入特征X咧虎,其中X的每一個(gè)列向量為每個(gè)樣本特征的平方歸一化,我們就能通過該特征向量構(gòu)建稠密對(duì)平方距離矩陣计呈,該矩陣中的任意元素D_{i,j} 即為x_{i} x_{j} 的嵌入特征向量之間的平方L2范數(shù)砰诵。

圖3??batch內(nèi)各元素的二次方范數(shù)列向量
圖4 稠密對(duì)平方距離矩陣

? ? ? ?那么在本文中,隨機(jī)采樣并不是完全隨機(jī)的而是集成了重要性采樣的元素捌显。我們首先隨機(jī)選擇一些正樣本對(duì)茁彭,然后靈活的添加它們的具有難度系數(shù)的近鄰到訓(xùn)練批量中。那正如我們前面所提到的苇瓣,嵌套max函數(shù)可能會(huì)導(dǎo)致網(wǎng)絡(luò)嵌入局部最優(yōu)解尉间,因此我們將max函數(shù)替換為光滑上界

圖5 難例挖掘過程

? ? ? ?那正如我們前面所提到的,嵌套max函數(shù)可能會(huì)導(dǎo)致網(wǎng)絡(luò)嵌入局部最優(yōu)解击罪,因此我們將max函數(shù)替換為光滑上界:

圖6 含光滑上界的損失函數(shù)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末哲嘲,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子媳禁,更是在濱河造成了極大的恐慌眠副,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,907評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件竣稽,死亡現(xiàn)場(chǎng)離奇詭異囱怕,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)毫别,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,987評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門娃弓,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人岛宦,你說我怎么就攤上這事台丛。” “怎么了砾肺?”我有些...
    開封第一講書人閱讀 164,298評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵挽霉,是天一觀的道長。 經(jīng)常有香客問我变汪,道長侠坎,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,586評(píng)論 1 293
  • 正文 為了忘掉前任裙盾,我火速辦了婚禮实胸,結(jié)果婚禮上他嫡,老公的妹妹穿的比我還像新娘。我一直安慰自己庐完,他們只是感情好涮瞻,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,633評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著假褪,像睡著了一般。 火紅的嫁衣襯著肌膚如雪近顷。 梳的紋絲不亂的頭發(fā)上生音,一...
    開封第一講書人閱讀 51,488評(píng)論 1 302
  • 那天,我揣著相機(jī)與錄音窒升,去河邊找鬼缀遍。 笑死,一個(gè)胖子當(dāng)著我的面吹牛饱须,可吹牛的內(nèi)容都是我干的域醇。 我是一名探鬼主播,決...
    沈念sama閱讀 40,275評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼蓉媳,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼譬挚!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起酪呻,我...
    開封第一講書人閱讀 39,176評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤减宣,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后玩荠,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體漆腌,經(jīng)...
    沈念sama閱讀 45,619評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,819評(píng)論 3 336
  • 正文 我和宋清朗相戀三年阶冈,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了闷尿。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,932評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡女坑,死狀恐怖填具,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情堂飞,我是刑警寧澤灌旧,帶...
    沈念sama閱讀 35,655評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站绰筛,受9級(jí)特大地震影響枢泰,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜铝噩,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,265評(píng)論 3 329
  • 文/蒙蒙 一衡蚂、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦毛甲、人聲如沸年叮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,871評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽只损。三九已至,卻和暖如春七咧,著一層夾襖步出監(jiān)牢的瞬間跃惫,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,994評(píng)論 1 269
  • 我被黑心中介騙來泰國打工艾栋, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留爆存,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,095評(píng)論 3 370
  • 正文 我出身青樓蝗砾,卻偏偏與公主長得像先较,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子悼粮,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,884評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容