Deep Supervised Hashing for Fast Image Retrieval 讀書報告

標(biāo)簽(空格分隔):
1.論文主要內(nèi)容
作者通過CNN網(wǎng)絡(luò)來學(xué)習(xí)圖片的hash code,作者在這個學(xué)習(xí)到過程當(dāng)中主要的創(chuàng)新之處在一下幾個方面棠隐。
1).不在是使用單張圖片進(jìn)行訓(xùn)練,而是通過輸入一對圖片來進(jìn)行訓(xùn)練果覆,標(biāo)簽是:如果這兩張圖片來自于同一類別,那么認(rèn)為他們是相似的,為正樣本精堕,否則不同的類別的兩張圖片認(rèn)為是負(fù)樣本凸克。
2).作者精心設(shè)計了損失函數(shù)议蟆。使得輸出空間也就是hash空間,盡可能的多樣化萎战,編碼更多原始圖片的信息咐容。同時限制值的。
在檢索階段:對于來的一張圖片可以通過訓(xùn)練的網(wǎng)絡(luò)生成hashcode,然后在圖片庫中進(jìn)行檢索蚂维,漢明距離的計算戳粒。
實驗:作者在兩個數(shù)據(jù)集上進(jìn)行了實驗:CIFAR-10,NUS_WIDE虫啥,兩個數(shù)據(jù)集上得到了其他方法要好的結(jié)果蔚约。
具體的論文細(xì)節(jié)如下:
1.網(wǎng)絡(luò)結(jié)構(gòu)

Paste_Image.png

2.損失函數(shù):

Paste_Image.png

其中:假設(shè)輸入的兩張圖片是I1,I2,得到的hashCode為b1,b2,為k維{+1,-1}向量涂籽,D(*)為Hamming distance
如果兩張圖片相似那么y=1否則y=0
第一項是在y=0的時候炊琉,說明兩個圖片相似,那么他們兩的漢明距離就是他們之間的損失又活,因為我們認(rèn)為相似的圖片的hashcode應(yīng)該是非常相近的苔咪。
第二項說明在,兩張圖片不相似的時候柳骄,他們之間的距離团赏,我們需要的是,不相似的圖片距離盡可能的大耐薯。使得作為損失函數(shù)的一部分的第二項盡可能的小舔清。其中m是一個閾值參數(shù)。
上面是對一對圖片的損失函數(shù)曲初,那么對于訓(xùn)練集我們可以得到如下的損失函數(shù):

Paste_Image.png

我們的目標(biāo)就是最小化損失函數(shù)体谒。但是對于上面的約束和其他論文的hashcode約束一樣,都是二值的臼婆,離散的抒痒,不可導(dǎo)。所以就出現(xiàn)了問題颁褂,在訓(xùn)練的時候故响,不好反向傳播誤差傀广。
下面就是對上面提出的損失函數(shù)進(jìn)行松弛,變成可導(dǎo)彩届,使得易于計算伪冰。

3.松弛
對上面的一對圖片寫成矩陣的表達(dá)形式,并添加正則項樟蠕。得到如下的損失函數(shù)贮聂。

Paste_Image.png

這里使用了l1正則,距離使用l2距離寨辩。

同時得到整體損失函數(shù)的矩陣表達(dá)形式:

Paste_Image.png

下面是在反向傳播的時候需要用到的導(dǎo)數(shù):

Paste_Image.png

通過作者提出來的這個訓(xùn)練框架寂汇,最后得到的hashcode 就是對b向量進(jìn)行二值化:sign(b)
作者沒有使用導(dǎo)非線性的一些函數(shù):tanh,sigmoid等等,具體的好處作者接下來會陳述捣染。

4具體的實現(xiàn)細(xì)節(jié)

使用Caffe來實現(xiàn):具體的網(wǎng)絡(luò)結(jié)構(gòu)在上面有展示骄瓣。
3層卷積和隨后的三層pooling層,兩層的全連接層耍攘。
使用的卷積核的個數(shù):32榕栏,32,64 大小為55 stride=1
pooling:3
3 stride=2
第一個全鏈接層:500個神經(jīng)元蕾各,第二層是k個神經(jīng)元扒磁,也就是hashcode的長度。
初始化:Xavier的參數(shù)作為初始化式曲,一篇文章里面提到的網(wǎng)絡(luò)參數(shù)妨托。
batch size = 200
momentum = 0.9
learning rate 0.001,沒20000次迭代之后,減少40%

訓(xùn)練的時候吝羞,圖片對是隨機(jī)選擇的兰伤。
訓(xùn)練是先選擇一部分較少的輸出層的然后,使用這些參數(shù)來微調(diào)到更長的hashCode

5實驗部分:
5.1數(shù)據(jù)集:
CIFAR-10:60000 32*32 10個類別钧排。512D-GIST特征敦腔,同一個類別認(rèn)為是相似的,否則不相似恨溜。5w訓(xùn)練符衔,1w測試。
NUS-WIDE:269648 81個標(biāo)注的多類別糟袁。作者使用21個最常用的概念(類別)每個類別5000張判族。兩張圖片只要有一個類別一樣,就認(rèn)為相似项戴。1w測試形帮,其他訓(xùn)練。

5.2實驗參數(shù)估計
正則參數(shù)的實驗:
在hashcode length k = 12基礎(chǔ)上實驗

Paste_Image.png

在線隨機(jī)生成訓(xùn)練圖片對和線下生成訓(xùn)練圖片對的比較

Paste_Image.png

可以看出來,在線的訓(xùn)練誤差下降的更快沃缘。

微調(diào)和從頭開始訓(xùn)練
作者提出來躯枢,在訓(xùn)練的時候则吟,首先把hashcode 長度設(shè)置的小一點(diǎn)槐臀,然后獲得一些參數(shù)之后,在把長度提高氓仲,用這些參數(shù)的值水慨,進(jìn)行訓(xùn)練。
作者進(jìn)行了一些列的對比

Paste_Image.png

看出來并不是從頭開始訓(xùn)練結(jié)果比較好敬扛,相反的是進(jìn)行微調(diào)效果會好晰洒。

Paste_Image.png

可以看出來,微調(diào)之后的結(jié)果要好于從頭開始訓(xùn)練的過程啥箭。

和傳統(tǒng)的方法進(jìn)行比較

Paste_Image.png

結(jié)論:
作者提出了非線性的特征學(xué)習(xí)和hashcode的面向特定任務(wù)的學(xué)習(xí)過程谍珊。
對于海明空間和原始空間中的正則項和實值的約束,還有在線訓(xùn)練樣本的生成急侥。
實驗表明作者提出的方法砌滞,優(yōu)于其他已存在的方法。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末坏怪,一起剝皮案震驚了整個濱河市贝润,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌铝宵,老刑警劉巖打掘,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異鹏秋,居然都是意外死亡尊蚁,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進(jìn)店門侣夷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來枝誊,“玉大人,你說我怎么就攤上這事惜纸∫度觯” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵耐版,是天一觀的道長祠够。 經(jīng)常有香客問我,道長粪牲,這世上最難降的妖魔是什么古瓤? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上落君,老公的妹妹穿的比我還像新娘穿香。我一直安慰自己,他們只是感情好绎速,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布皮获。 她就那樣靜靜地躺著,像睡著了一般纹冤。 火紅的嫁衣襯著肌膚如雪洒宝。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天萌京,我揣著相機(jī)與錄音雁歌,去河邊找鬼。 笑死知残,一個胖子當(dāng)著我的面吹牛靠瞎,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播求妹,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼乏盐,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了扒最?” 一聲冷哼從身側(cè)響起丑勤,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎吧趣,沒想到半個月后法竞,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡强挫,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年岔霸,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片俯渤。...
    茶點(diǎn)故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡呆细,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出八匠,到底是詐尸還是另有隱情絮爷,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布梨树,位于F島的核電站坑夯,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏抡四。R本人自食惡果不足惜柜蜈,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一仗谆、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧淑履,春花似錦隶垮、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至缆娃,卻和暖如春捷绒,著一層夾襖步出監(jiān)牢的瞬間瑰排,已是汗流浹背贯要。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留椭住,地道東北人崇渗。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像京郑,于是被迫代替她去往敵國和親宅广。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容