CBAM: Convolutional Block Attention Module


更多注意力機(jī)制相關(guān)文章尉辑,請(qǐng)看這篇論文總結(jié)RAM: Residual Attention Module for Single Image Super-Resolution

概述

  1. 為了提升CNNs(卷積神經(jīng)網(wǎng)絡(luò))效果此再,一些研究者嘗試從三個(gè)方面著手:depth筷狼、width裕偿、cardinality,各自典型代表:
  • depth:VGGNet爪幻、ResNet
  • width:GoogLeNet
  • cardinality:Xception菱皆、ResNeXt
  1. 作者嘗試從另一個(gè)角度出發(fā)—attention须误,attention適用于很多計(jì)算機(jī)視覺(jué)任務(wù),例如圖片分類(lèi)仇轻、語(yǔ)義分割京痢、邊緣檢測(cè)、姿態(tài)估計(jì)等篷店。Attention可分為兩類(lèi):基于通道(channel)和基于空間(spatial)祭椰,前者關(guān)注更重要的特征(每個(gè)通道都是一種特征),后者留意在哪個(gè)位置關(guān)注疲陕,即作者所說(shuō)的learn ‘what’ and ‘where’方淤。
  2. 作者組合這兩類(lèi)attention,提出 Convolutional Block Attention Module(CBAM)蹄殃⌒基于主干網(wǎng)絡(luò)ResNet18、ResNet34诅岩、ResNet101讳苦、WideResNet18、ResNeXt50吩谦、ResNeXt101鸳谜、MobileNet、VGG16式廷,在數(shù)據(jù)集ImageNet-1K上測(cè)試圖片分類(lèi)咐扭,在數(shù)據(jù)集 MS COCOVOC 2007上測(cè)試物體檢測(cè)。驗(yàn)證了CBAM不僅通用性強(qiáng)滑废,而且在不明顯增加參數(shù)量的情況下草描,能提升網(wǎng)絡(luò)效果。

CBAM結(jié)構(gòu)


在給定輸入特征F的情況下策严,CBAM模塊先學(xué)到1維的通道注意力圖(Channel Attention map)—Mc,再學(xué)到2維的空間注意力圖(Spatial Attention map)—Ms饿敲,這個(gè)attention過(guò)程可用如下公式表達(dá):

其中妻导,

  • 通道注意力模塊(Channel attention module)
    該模塊先利用全局平均池化(global average-pooling)全局最大值池化(global max-pooling)操作同時(shí)抽取通道上的特征;然后通過(guò)共享一個(gè)多層感知機(jī)(multi-layer perceptron)進(jìn)一步得到通道上的特征怀各;最終這兩種特征點(diǎn)加(element-wise summation)倔韭,并使用sigmoid激活后得到Channel Attention map。公式表達(dá)為:
  • 空間注意力模塊(Spatial attention module)
    該模塊同時(shí)在通道維度上取平均值和最大值瓢对,得到兩個(gè)二維空間特征寿酌;之后concatenate一起,經(jīng)過(guò)卷積得到最終的Spatial Attention map硕蛹。公式表達(dá)為:

    這里的7x7代表卷積核大小醇疼。
  • 如何組合通道和空間注意力模塊硕并?
    后續(xù)實(shí)驗(yàn)證明:串聯(lián)比并聯(lián)效果好,通道模塊接空間模塊效果好

實(shí)驗(yàn)

  1. Ablation studies
    數(shù)據(jù)集:ImageNet-1K
    Baseline:ResNet50
    在現(xiàn)有ResNet結(jié)構(gòu)中秧荆,CBAM可以添加到每個(gè)block的輸出特征之后:

    作者針對(duì) Channel attention倔毙、Spatial attention以及二者如何組合做了各個(gè)實(shí)驗(yàn):
  • Channel attention



    該實(shí)驗(yàn)結(jié)果中發(fā)現(xiàn)綜合AvgPool和MaxPool效果比單一使用其中之一要好。

  • Spatial attention


    image.png

    該實(shí)驗(yàn)結(jié)果中發(fā)現(xiàn)綜合Avg和Max乙濒,并使用7x7卷積核效果最好陕赃。

  • 二者如何組合



    該實(shí)驗(yàn)結(jié)果表明:串聯(lián)比并聯(lián)效果要好;先通道注意力后空間注意力效果要更好颁股。

  1. Image Classification on ImageNet-1K
  • 該實(shí)驗(yàn)基于主干網(wǎng)絡(luò):ResNet么库、WideResNet、ResNext甘有,驗(yàn)證了CBAM的有效性诉儒,而且參數(shù)量和計(jì)算量提升不明顯:


  • 作者同時(shí)也對(duì)不同主干網(wǎng)絡(luò)的最后一層輸出特征做了可視化,并給出目標(biāo)分類(lèi)的softmax值(P):

    發(fā)現(xiàn)添加CBAM之后梧疲,網(wǎng)絡(luò)能更加關(guān)注到目標(biāo)分類(lèi)的區(qū)域允睹。可視化方法來(lái)自:
    Selvaraju, R.R., Cogswell, M., Das, A., Vedantam, R., Parikh, D., Batra, D.: Grad- cam: Visual explanations from deep networks via gradient-based localization. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. (2017) 618–626
  1. Object Detection
  • MS COCO
    目標(biāo)檢測(cè)采取方法Faster-RCNN幌氮,主干為帶預(yù)訓(xùn)練權(quán)重的 ResNet50和ResNet101:



    實(shí)驗(yàn)證明:添加CBAM模塊后缭受,不同主干網(wǎng)絡(luò)的效果都有提升。

  • VOC 2007
    目標(biāo)檢測(cè)采取方法StairNet该互,它又基于SSD米者,主干網(wǎng)絡(luò)有VGG16和MobileNet:



    實(shí)驗(yàn)證明:添加CBAM模塊后,不同主干網(wǎng)絡(luò)的效果都有提升宇智,即使在輕量級(jí)網(wǎng)絡(luò)MobileNet下也有提升蔓搞。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市随橘,隨后出現(xiàn)的幾起案子喂分,更是在濱河造成了極大的恐慌,老刑警劉巖机蔗,帶你破解...
    沈念sama閱讀 216,651評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蒲祈,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡萝嘁,警方通過(guò)查閱死者的電腦和手機(jī)梆掸,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,468評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)牙言,“玉大人酸钦,你說(shuō)我怎么就攤上這事≡弁鳎” “怎么了卑硫?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,931評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵徒恋,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我拔恰,道長(zhǎng)因谎,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,218評(píng)論 1 292
  • 正文 為了忘掉前任颜懊,我火速辦了婚禮财岔,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘河爹。我一直安慰自己匠璧,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,234評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布咸这。 她就那樣靜靜地躺著夷恍,像睡著了一般。 火紅的嫁衣襯著肌膚如雪媳维。 梳的紋絲不亂的頭發(fā)上酿雪,一...
    開(kāi)封第一講書(shū)人閱讀 51,198評(píng)論 1 299
  • 那天,我揣著相機(jī)與錄音侄刽,去河邊找鬼指黎。 笑死,一個(gè)胖子當(dāng)著我的面吹牛州丹,可吹牛的內(nèi)容都是我干的醋安。 我是一名探鬼主播,決...
    沈念sama閱讀 40,084評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼墓毒,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼吓揪!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起所计,我...
    開(kāi)封第一講書(shū)人閱讀 38,926評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤柠辞,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后主胧,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體钾腺,經(jīng)...
    沈念sama閱讀 45,341評(píng)論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,563評(píng)論 2 333
  • 正文 我和宋清朗相戀三年讥裤,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片姻报。...
    茶點(diǎn)故事閱讀 39,731評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡己英,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出吴旋,到底是詐尸還是另有隱情损肛,我是刑警寧澤厢破,帶...
    沈念sama閱讀 35,430評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站治拿,受9級(jí)特大地震影響摩泪,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜劫谅,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,036評(píng)論 3 326
  • 文/蒙蒙 一见坑、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧捏检,春花似錦荞驴、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,676評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至能犯,卻和暖如春鲫骗,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背踩晶。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,829評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工执泰, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人合瓢。 一個(gè)月前我還...
    沈念sama閱讀 47,743評(píng)論 2 368
  • 正文 我出身青樓坦胶,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親晴楔。 傳聞我的和親對(duì)象是個(gè)殘疾皇子顿苇,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,629評(píng)論 2 354