<論文筆記>——Learn to Pay Attention

注:部分轉(zhuǎn)載于http://www.reibang.com/p/d5c968e0e194(博主:月牙眼的樓下小黑)

發(fā)表于:ICLR 2018 (Poster)
代碼地址:https://github.com/SaoYan/LearnToPayAttention

論文類(lèi)型:注意力機(jī)制用于分類(lèi)網(wǎng)絡(luò)


摘要:提出一種注意力生成機(jī)制队贱,使用全局特征(global feature)為不同尺度上的特征圖(local feature)生成Attention Map, 強(qiáng)制網(wǎng)絡(luò)僅使用不同尺度的Local feature結(jié)合對(duì)應(yīng)的Attention Map進(jìn)行最終分類(lèi)靡努,并使得不同scale的Attention map關(guān)注圖像不同的區(qū)域,互相補(bǔ)充忠荞。


亮點(diǎn)

  • 全局特征被視作一種Query, 直接影響Attention maps的生成
  • 不同scale的Attention map關(guān)注圖像不同的區(qū)域,互相補(bǔ)充
  • 強(qiáng)制網(wǎng)絡(luò)僅使用local features進(jìn)行分類(lèi)
  • 使用了不同尺度上的特征進(jìn)行融合

模型概覽

注意力機(jī)制

VGG網(wǎng)絡(luò)流程

流程概述
如上圖所示,L: [L1夫嗓、L2桐玻、L3]分別為VGG網(wǎng)絡(luò)中不同尺度下的中間特征輸出(local feature篙挽,原屬于VGG網(wǎng)絡(luò)的最終分類(lèi)層FC-2, 10被移除,全連接層FC-1, 512的輸出G即被視作全局特征 (global feature)镊靴,Attention Estimator接收LnG作為輸入铣卡,計(jì)算出Attention map, Attention map作用于Ln的每一個(gè)channel得到 Weighted local feature L'n链韭。各個(gè)scale下的L'n進(jìn)行concat之后得到L':[L'1、L'2煮落、L'3]敞峭,最后將L'送入全連接層分類(lèi)器FC-2, 10進(jìn)行最終分類(lèi)。


關(guān)鍵操作和細(xì)節(jié)

  • Attention map 具體如何計(jì)算得到蝉仇?
    論文中提出了兩種方法通過(guò)L和G來(lái)計(jì)算Attention map
    1.有參法(parameterised)將兩個(gè)張量逐元素相加后旋讹,再經(jīng)過(guò)一個(gè)線性映射(1x1的卷積)學(xué)習(xí)Attention map, 下式中u即代表學(xué)習(xí)到的線性映射
    有參法

    2.點(diǎn)乘法(dot-product-based): 將兩個(gè)張量直接做點(diǎn)乘得到Attention map
    點(diǎn)乘法
  • Attention Estimator 的輸入為維度不一定相同的GL/不同的中間輸出特征G之間維度不同轿衔,如何處理骗村?
    使用映射函數(shù)(project function),將特征映射到相同維度(相同通道數(shù))呀枢,具體的操作即為使用1x1的卷積對(duì)特征進(jìn)行升/降維胚股,論文源碼將中間層輸出特征都映射為和全局特征維度一致。

思想
1.利用Attention map來(lái)確認(rèn)和尋找那些有效支持CNN模型做出選擇的區(qū)域(這和CAM的想法類(lèi)似)裙秋,這個(gè)方法的一個(gè)重要前提假設(shè)是:施加更多的關(guān)注在圖像的顯著性區(qū)域上琅拌,同時(shí)減輕對(duì)那些不相關(guān)或者易混淆區(qū)域的關(guān)注是對(duì)分類(lèi)有益的;對(duì)圖像更集中和簡(jiǎn)潔的使用更有助于數(shù)據(jù)分布發(fā)生變化時(shí)網(wǎng)絡(luò)的魯棒性摘刑。
2.本文中Attention map其實(shí)是local feature和global feature間的compatibility的表現(xiàn)形式进宝,兩類(lèi)特征的compatibility(兼容性)由上文提到的有參法或者點(diǎn)乘法得到。每個(gè)compatibility作為中間特征的注意力權(quán)重枷恕。
3.通過(guò)強(qiáng)制使用中間特征輸出的集合進(jìn)行分類(lèi)党晋,強(qiáng)制使得網(wǎng)絡(luò)去學(xué)習(xí)解決當(dāng)前任務(wù)的特定的Attention模式。


實(shí)驗(yàn)
作者分別在分類(lèi)任務(wù)徐块、細(xì)粒度圖像分類(lèi)任務(wù)未玻、弱監(jiān)督分割任務(wù)、對(duì)抗樣本攻擊胡控、跨領(lǐng)域圖像分類(lèi)任務(wù)上進(jìn)行了實(shí)驗(yàn)扳剿,均取得了不錯(cuò)的結(jié)果。

  • 細(xì)粒度圖像分類(lèi):作者在鳥(niǎo)類(lèi)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)昼激,不同scale的Attention區(qū)域關(guān)注鳥(niǎo)的不同身體部位庇绽。
  • 弱監(jiān)督分割任務(wù):不同特征圖的Attention map關(guān)注目標(biāo)的不同區(qū)域,互相補(bǔ)充橙困,多張Attention map能夠更精準(zhǔn)瞧掺、更完整地覆蓋目標(biāo)區(qū)域。
  • 對(duì)抗樣本攻擊:模型對(duì)對(duì)抗樣本的魯棒性更強(qiáng)了凡傅。
  • 跨領(lǐng)域圖像分類(lèi):模型特征提取能力更易遷移辟狈。

除此之外,作者還對(duì)生成Attention map的兩種方法進(jìn)行了實(shí)驗(yàn)分析像捶,分析了兩種方法的不同上陕。

Query-driven attention

如上圖所示,先利用一幅 target image的 global vector 和 local feature map 產(chǎn)生 attention map (第三拓春、六列), 然后再選取另一張圖片作為 query image, 利用 query image 的 global vector 和 target image 的 local feature map 產(chǎn)生 attention map( 第四释簿、七列) , 比較兩個(gè)attention map 的異同(第五硼莽、八列)庶溶。

  • 對(duì)于點(diǎn)乘法產(chǎn)生Attention map來(lái)說(shuō),global feature直接影響Attention map的生成懂鸵,會(huì)使得網(wǎng)絡(luò)關(guān)注和query image中目標(biāo)相同類(lèi)別的目標(biāo)區(qū)域偏螺;
  • 而對(duì)于有參法來(lái)說(shuō),global feature對(duì)Attention map幾乎沒(méi)有影響匆光,作者得出的結(jié)論是有參法學(xué)習(xí)到的映射函數(shù)的權(quán)重u能夠去學(xué)習(xí)目標(biāo)為中心的高階特征套像,這些特征能夠較好地進(jìn)行從訓(xùn)練數(shù)據(jù)泛化到驗(yàn)證數(shù)據(jù),因?yàn)樗鼈兊念?lèi)別相似终息;還有一個(gè)原因就是global featurelocal feature在數(shù)值量級(jí)上差距過(guò)大夺巩。

一些啟示
一開(kāi)始看到這篇論文并沒(méi)有覺(jué)得非常solid或者有什么insight,在仔細(xì)閱讀完整篇論文之后有所改觀周崭。作者不僅僅是使用不同尺度的中間特征來(lái)進(jìn)行分類(lèi)柳譬,而是以global feature作為一種Query來(lái)控制中間特征需要關(guān)注的區(qū)域。
還有一個(gè)值得注意的點(diǎn):作者提到全局特征和局部特征數(shù)值量級(jí)差距過(guò)大续镇,這需要我在實(shí)驗(yàn)中被進(jìn)一步證實(shí)美澳,如果屬實(shí),那在對(duì)中間特征和全局特征進(jìn)行融合或者拼接時(shí)應(yīng)該考慮進(jìn)行歸一化操作摸航。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末制跟,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子酱虎,更是在濱河造成了極大的恐慌凫岖,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,546評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件逢净,死亡現(xiàn)場(chǎng)離奇詭異哥放,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)爹土,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)甥雕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人胀茵,你說(shuō)我怎么就攤上這事社露。” “怎么了琼娘?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,911評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵峭弟,是天一觀的道長(zhǎng)附鸽。 經(jīng)常有香客問(wèn)我,道長(zhǎng)瞒瘸,這世上最難降的妖魔是什么坷备? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,737評(píng)論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮情臭,結(jié)果婚禮上省撑,老公的妹妹穿的比我還像新娘。我一直安慰自己俯在,他們只是感情好竟秫,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,753評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著跷乐,像睡著了一般肥败。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上愕提,一...
    開(kāi)封第一講書(shū)人閱讀 51,598評(píng)論 1 305
  • 那天拙吉,我揣著相機(jī)與錄音,去河邊找鬼揪荣。 笑死筷黔,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的仗颈。 我是一名探鬼主播佛舱,決...
    沈念sama閱讀 40,338評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼挨决!你這毒婦竟也來(lái)了请祖?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,249評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤脖祈,失蹤者是張志新(化名)和其女友劉穎肆捕,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體盖高,經(jīng)...
    沈念sama閱讀 45,696評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡慎陵,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,888評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了喻奥。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片席纽。...
    茶點(diǎn)故事閱讀 40,013評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖撞蚕,靈堂內(nèi)的尸體忽然破棺而出润梯,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 35,731評(píng)論 5 346
  • 正文 年R本政府宣布纺铭,位于F島的核電站寇钉,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏舶赔。R本人自食惡果不足惜扫倡,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,348評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望顿痪。 院中可真熱鬧镊辕,春花似錦油够、人聲如沸蚁袭。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,929評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)揩悄。三九已至,卻和暖如春鬼悠,著一層夾襖步出監(jiān)牢的瞬間删性,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,048評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工焕窝, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蹬挺,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,203評(píng)論 3 370
  • 正文 我出身青樓它掂,卻偏偏與公主長(zhǎng)得像巴帮,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子虐秋,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,960評(píng)論 2 355