NetVLAD

????相應論文是“NetVALD: CNN architecture for weakly supervised place recognition”草描。

????首先要明白VLAD是干什么的——VLAD(Vector of Locally Aggregated Descriptors)是一種用聚合后的局部特征來表示全局特征的編碼方法浦箱。編碼算法的具體公式是V(j,k)=\sum_{i=1}^Na_{k}(x_{i} )(x_{i}(j)-C_{k}(j))  嫩海。x是輸入信息(比如圖像經(jīng)過CNN處理后的多層特征圖),C是聚類后的中心點(共有k個簇)扮惦,而a_{k}(x_{i}) 是判斷x_{i} 屬于第k個簇的可能性兔沃。由公式可知脖祈,a_{k}(x_{i}) 與k乙墙,i都有關,因此可以這樣理解掌实,如果將CNN提取的H*W*D的特征看作是H*W個D維特征陪蜻,這H*W個特征都有著子集對應的簇中心,而簇有k個贱鼻,所以a有(H*W)*k個取值宴卖,但是a只能取1或者0(x_{i} C_{k} 相距最近則取1,否則取0)邻悬。公式中x與i症昏,j有關,其實就是說明了x是(H*W)個D維向量父丰,而C是與k肝谭,j有關,就是說C是k個D維向量。

? ? 所以攘烛,\sum_{i=1}^Na_{k}(x_{i})(x_{i}(j)-C_{k}(j))  就是說魏滚,對于每一張feature map上的每個點,分別求其余對應的簇中心點的差值和坟漱。所以結(jié)果V是一個k*D的矩陣栏赴,也就是每一張feature map都要與所有的簇中心計算一個差值,但只保留與最近的簇計算的差值靖秩。VLAD保存的是每個特征點與離它最近的聚類中心的距離,并將其作為新的編碼特征竖瘾,用于后接的分類器中沟突。

? ? 我的理解就是VLAD其實就是找個k個簇,使得這k個簇可以盡可能的表征原feature map捕传。V就體現(xiàn)了二者的差異性惠拭,值越小,說明原feature與對應的簇越接近庸论。訓練階段就是利用V和BP算法不斷修正簇中心對應的向量职辅,為每個簇學習到一個更好的anchor,使得新的差值更小聂示。這里我理解錯了域携,V是對原始特征編碼后的新特征,還需要在V后面接上一個分類器就可以組成一個完整的模型并開始訓練了鱼喉。

? ? 那么NetVALD做了一個什么改進呢秀鞭?其實就是對a做了改進。a表示的是某一個feature與所有的簇的關系扛禽,傳統(tǒng)VLAD中的a是硬分配方式锋边,就是說將feature強制性分給一個簇,此時a可以表示為[0,0,...,1,0,0,...,0]编曼。這種一刀切的做法肯定不是很好豆巨,會造成一定的信息丟失。更好的方式是軟分配方式掐场,也就是將feature與每個簇的關系用一個概率值表示(最終所有的概率值之和為1)往扔,此時a可以表示為[0.1,0.7,...,0.08,...,0.01]。此時的a就不再是固定的1和0了刻肄,而是可以看成是一個神經(jīng)網(wǎng)絡的輸出a_{k}(x_{i})=\frac{e^{w_{a}^Tx_{i}+b_{k}}}{\sum_{k=1}^Ke^{w_{a}^Tx_{i}+b_{k}}}瓤球,此時模型的損失函數(shù)V就變成V(j,k)=\sum_{i=1}^N\frac{e^{w_{a}^Tx_{i}+b_{k}}}{\sum_{k=1}^Ke^{w_{a}^Tx_{i}+b_{k}}}(x_{i}(j)-c_{k}(j))。相比于VLAD敏弃,NetVLAD包含更多的參數(shù)(a由固定的1卦羡、0表示變成神經(jīng)網(wǎng)絡表示),因此有著更好的適應性和學習性。原論文中的圖更加直觀地體現(xiàn)了這種適應性绿饵。


NetVLAD相對于VLAD的自適應性

????具體的實現(xiàn)流程圖我就截取另一篇論文NeXtVLAD: An Efficient Neural Network to Aggregate Frame-level Features for Large-scale Video Classification中的圖:

NetVLAD流程圖

編碼過程其實就是虛線框中的內(nèi)容欠肾,要學習的參數(shù)主要有兩類,一類是下面生成\alpha 的FC層中的參數(shù)拟赊,共有N*K個刺桃,一類是上面簇中心向量c,也是有N*K個吸祟。

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末瑟慈,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子屋匕,更是在濱河造成了極大的恐慌葛碧,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,290評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件过吻,死亡現(xiàn)場離奇詭異进泼,居然都是意外死亡,警方通過查閱死者的電腦和手機纤虽,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評論 2 385
  • 文/潘曉璐 我一進店門乳绕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人逼纸,你說我怎么就攤上這事洋措。” “怎么了樊展?”我有些...
    開封第一講書人閱讀 156,872評論 0 347
  • 文/不壞的土叔 我叫張陵呻纹,是天一觀的道長。 經(jīng)常有香客問我专缠,道長雷酪,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,415評論 1 283
  • 正文 為了忘掉前任涝婉,我火速辦了婚禮哥力,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘墩弯。我一直安慰自己吩跋,他們只是感情好,可當我...
    茶點故事閱讀 65,453評論 6 385
  • 文/花漫 我一把揭開白布渔工。 她就那樣靜靜地躺著锌钮,像睡著了一般。 火紅的嫁衣襯著肌膚如雪引矩。 梳的紋絲不亂的頭發(fā)上梁丘,一...
    開封第一講書人閱讀 49,784評論 1 290
  • 那天侵浸,我揣著相機與錄音,去河邊找鬼氛谜。 笑死掏觉,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的值漫。 我是一名探鬼主播澳腹,決...
    沈念sama閱讀 38,927評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼杨何!你這毒婦竟也來了酱塔?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,691評論 0 266
  • 序言:老撾萬榮一對情侶失蹤危虱,失蹤者是張志新(化名)和其女友劉穎延旧,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體槽地,經(jīng)...
    沈念sama閱讀 44,137評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,472評論 2 326
  • 正文 我和宋清朗相戀三年芦瘾,在試婚紗的時候發(fā)現(xiàn)自己被綠了捌蚊。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,622評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡近弟,死狀恐怖缅糟,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情祷愉,我是刑警寧澤窗宦,帶...
    沈念sama閱讀 34,289評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站二鳄,受9級特大地震影響赴涵,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜订讼,卻給世界環(huán)境...
    茶點故事閱讀 39,887評論 3 312
  • 文/蒙蒙 一髓窜、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧欺殿,春花似錦寄纵、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至棍潘,卻和暖如春恃鞋,著一層夾襖步出監(jiān)牢的瞬間崖媚,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工山宾, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留至扰,地道東北人。 一個月前我還...
    沈念sama閱讀 46,316評論 2 360
  • 正文 我出身青樓资锰,卻偏偏與公主長得像敢课,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子绷杜,可洞房花燭夜當晚...
    茶點故事閱讀 43,490評論 2 348

推薦閱讀更多精彩內(nèi)容