LESA可以讓你的低計(jì)算力模型也可以有局部信息和上下文信息

01?簡介

在計(jì)算機(jī)視覺模型中搬素，Self-Attention已經(jīng)成為一種普遍模塊绷耍。盡管它取得了顯著的成就，但對Self-Attention的理解仍然有限忽刽。它的優(yōu)點(diǎn)之一是克服了空間距離對依賴性建模的限制天揖。

與LSTM和門控RNN相比，Self-Attention源于自然語言處理跪帝，在不考慮序列中單詞之間距離的情況下對遠(yuǎn)距離依賴關(guān)系進(jìn)行建模今膊。

在應(yīng)用于視覺模型時(shí)，Self-Attention將像素或Patch之間的全局信息聚集起來伞剑。同樣斑唬，與傳統(tǒng)的卷積相比，通過Self-Attention提取的特征不再受局部鄰域的約束黎泣。

而LTSA作者認(rèn)為恕刘，Self-Attention中的全局聚合也會(huì)帶來問題，因?yàn)榫酆系奶卣鞑荒芮宄貐^(qū)分local cues和contextual cues抒倚。

作者從條件隨機(jī)場(CRF)的角度來研究這個(gè)問題褐着，并將其分解為local term和context term。而unary term(Local)和binary term(Context)則基于相同的query托呕、key和value構(gòu)建塊含蓉，并使用相同的投影矩陣計(jì)算。

假設(shè)项郊，使用相同的構(gòu)建模塊的local term和context term將導(dǎo)致問題馅扣，這與Dong等人指出的Self-Attention映射的弱點(diǎn)有關(guān)。

他們從理論上證明了連續(xù)Self-Attention的輸出會(huì)以雙指數(shù)形式收斂到一個(gè)秩1矩陣着降，并從經(jīng)驗(yàn)上驗(yàn)證了這種退化差油。他們還聲稱skip connection可以部分解決排序崩潰問題。

在作者的CRF分析中任洞，skip connection創(chuàng)建了最簡單的local term蓄喇，這相當(dāng)于標(biāo)識(shí)映射食绿。雖然skip connection緩解了這個(gè)問題，但作者認(rèn)為仍然需要設(shè)計(jì)一個(gè)具有更強(qiáng)表示能力的Local term公罕。

02?本文方法

對于提升Local Term的表征能力器紧，作者受全連接條件隨機(jī)場(CRF)的啟發(fā)，將自注意力分解為Local term和Context term楼眷。它們對應(yīng)于CRF中的unary term和binary term铲汪，并由投影矩陣的注意力機(jī)制實(shí)現(xiàn)。

作者發(fā)現(xiàn)罐柳，unary term對輸出的貢獻(xiàn)很小掌腰，而標(biāo)準(zhǔn)的CNN僅依賴于unary term，在各種任務(wù)上都取得了很好的性能张吉。

因此齿梁，作者提出了局部增強(qiáng)的自注意力機(jī)制(LESA)，它通過將unary term與卷積結(jié)合來增強(qiáng)unary term肮蛹，并利用融合模塊動(dòng)態(tài)耦合unary和binary運(yùn)算勺择。

1.分解Self-Attention

可以將Self-Attention分解為Local term和Context term。

具體來說伦忠，可以將Self-Attention的公式寫成：

對于空間位置(i,j)省核，第一個(gè)Local term通過觀察自身來計(jì)算激活，而第二個(gè)Context term通過觀察他人來計(jì)算激活昆码，然后由softmax來生成貢獻(xiàn)權(quán)重气忠。

因此，輸出混合了局部和上下文特征赋咽。

作者進(jìn)行消融實(shí)驗(yàn)研究旧噪，以調(diào)查這兩個(gè)term的貢獻(xiàn)。具體來說脓匿，采用ResNet50淘钟，并將其最后兩個(gè)階段的卷積層替換為Self-Attention。

可以看到亦镶，Self-Attention主要是由Binary運(yùn)算貢獻(xiàn)的日月，但Unary也很重要袱瓮。雖然Unary項(xiàng)的權(quán)值只取小于2%缤骨，去除它會(huì)導(dǎo)致7.56%的準(zhǔn)確率下降或35%的錯(cuò)誤率相對增加。

通過這種分解方法分析Self-Attention時(shí)尺借，Unary項(xiàng)起著重要作用绊起，但大部分的計(jì)算和重點(diǎn)都集中在Binary運(yùn)算上。

2.?局部增強(qiáng)Self-Attention

添加Unary項(xiàng)和Binary項(xiàng)是一種靜態(tài)的方法燎斩，可以用相等的權(quán)重合并這兩個(gè)項(xiàng)虱歪。更靈活的策略是在不同的情況下給兩者分配權(quán)重蜂绎。

例如，在目標(biāo)檢測中笋鄙，當(dāng)檢測圖像中的多個(gè)小目標(biāo)時(shí)师枣，像素依賴的局部性比上下文更重要。

具體來說萧落，和Sigmoid一起可以將pipeline表示為F+Sigmoid（BN - ReLU - FC - BN - ReLU - FC - BN - Sigmoid）践美。為簡單起見，在公式中省略了位置嵌入找岖。

在設(shè)計(jì)中陨倡，w根據(jù)Unary項(xiàng)和Binary項(xiàng)的內(nèi)容，在不同的空間位置和不同的特征通道中控制它們的相對權(quán)重许布。

3.Unary和Binary Terms的動(dòng)態(tài)融合

添加Unary項(xiàng)和Binary項(xiàng)是合并具有相等權(quán)重的2個(gè)項(xiàng)的靜態(tài)方式兴革。更靈活的策略是在不同情況下按需分配權(quán)重。例如蜜唾，在目標(biāo)檢測中杂曲，當(dāng)檢測圖像中的多個(gè)小目標(biāo)時(shí)，像素依賴的局部性比上下文更重要袁余。

這里作者通過將Binary項(xiàng)乘以并自適應(yīng)調(diào)整這2項(xiàng)的相對權(quán)重解阅，如下式所示：

具體來說，和Sigmoid可以表示為：

在設(shè)計(jì)中泌霍，ω取決于Unary項(xiàng)和Binary項(xiàng)的內(nèi)容货抄，并控制它們在不同空間位置和不同特征通道中的相對權(quán)重。這是融合Unary項(xiàng)和Binary項(xiàng)的主要方式朱转。

03?實(shí)驗(yàn)

1.圖像分類

結(jié)果如表所示蟹地。準(zhǔn)確度top-1和top-5中，LESA都超過了卷積和Self-Attention的Baseline藤为。

動(dòng)態(tài)融合模塊使用等式中的w來控制Binary項(xiàng)怪与。則Unary項(xiàng)和Binary項(xiàng)的權(quán)值分別為1+w和w/1+w。由于w依賴于輸入缅疟、空間位置和特征通道分别，在記錄中對它們的權(quán)重進(jìn)行平均。

在自注意中存淫，通過表1中使用的softmax操作計(jì)算權(quán)重耘斩。研究發(fā)現(xiàn)，Self-Attention中權(quán)重分布是不平衡的桅咆。Unary項(xiàng)的權(quán)重百分比小于3%括授，比Binary項(xiàng)的權(quán)重百分比小32倍以上。

而對于LESA，它們的權(quán)重百分比分別為67%和33%荚虚。在局部線索尤為重要的目標(biāo)檢測任務(wù)中薛夜，LESA表現(xiàn)出了更好的提高，如表3和表4所示版述。

2.目標(biāo)檢測與實(shí)例分割

結(jié)果如表3和表4所示梯澜。對val2017和test-dev2017使用相同的測試。與所有場景中的卷積渴析、Self-Attention和DCN Baseline相比腊徙，LESA為所有小、中檬某、大目標(biāo)提供了最好的BBox mAP和Mask mAP撬腾。

3.結(jié)果對比

通過上圖可以看出，LESA的效果明顯優(yōu)于CNN和Self-Attention恢恼。

04?總結(jié)

這項(xiàng)工作主要啟發(fā)點(diǎn)是來自于條件隨機(jī)場民傻，從CRF的角度將Self-Attention分解為一階和二階項(xiàng)，也就是文中所謂的Unary Term和Binary Term场斑。

對于局部信息和全局信息所對應(yīng)的Local Feature和Global Feature的關(guān)注在之前的各種工作中都沒有得到很好的平衡漓踢；

因此作者針對于這一點(diǎn)提出了自己的觀點(diǎn)設(shè)計(jì)了全新的局部信息增強(qiáng)模塊，也就是LESA注意力機(jī)制漏隐，首先是通過Unary Term與卷積相結(jié)合來增強(qiáng)模型局部信息的表達(dá)能力喧半，

其次，提出了動(dòng)態(tài)化的融合Unary Term和Binary Term青责，進(jìn)而可以更好的讓該模塊適配于不同的下游任務(wù)挺据，比如說針對檢測任務(wù)，尤其是其中的小目標(biāo)脖隶，這時(shí)的局部信息就顯得格外的重要扁耐，而針對于分類任務(wù)，可能全局信息更為重要产阱，可見動(dòng)態(tài)融合這方面還是一個(gè)不錯(cuò)的Trick的婉称。

但是LESA與標(biāo)準(zhǔn)的Self-Attention一樣，都具有會(huì)消耗大量內(nèi)存的問題构蹬。因?yàn)檫@些計(jì)算量都是由于query與key計(jì)算相似度矩陣多帶來了王暗。目前也有很多工作在嘗試解決這個(gè)問題。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末庄敛，一起剝皮案震驚了整個(gè)濱河市俗壹，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌铐姚，老刑警劉巖策肝，帶你破解...
沈念sama閱讀 218,204評論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異隐绵，居然都是意外死亡之众，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,091評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門依许，熙熙樓的掌柜王于貴愁眉苦臉地迎上來棺禾，“玉大人，你說我怎么就攤上這事峭跳”焐簦” “怎么了？”我有些...
開封第一講書人閱讀 164,548評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵蛀醉，是天一觀的道長悬襟。經(jīng)常有香客問我，道長拯刁，這世上最難降的妖魔是什么脊岳？我笑而不...
開封第一講書人閱讀 58,657評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮垛玻，結(jié)果婚禮上割捅，老公的妹妹穿的比我還像新娘。我一直安慰自己帚桩，他們只是感情好亿驾，可當(dāng)我...
茶點(diǎn)故事閱讀 67,689評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著账嚎，像睡著了一般莫瞬。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上郭蕉，一...
開封第一講書人閱讀 51,554評論 1贊 305
城市分裂傳說
那天乏悄，我揣著相機(jī)與錄音，去河邊找鬼恳不。笑死檩小，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的烟勋。我是一名探鬼主播规求，決...
沈念sama閱讀 40,302評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼卵惦！你這毒婦竟也來了阻肿？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,216評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤沮尿，失蹤者是張志新（化名）和其女友劉穎丛塌，沒想到半個(gè)月后较解，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,661評論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡赴邻，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,851評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年印衔，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片姥敛。...
茶點(diǎn)故事閱讀 39,977評論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡奸焙，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出彤敛，到底是詐尸還是另有隱情与帆，我是刑警寧澤，帶...
沈念sama閱讀 35,697評論 5贊 347
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布墨榄，位于F島的核電站玄糟，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏袄秩。R本人自食惡果不足惜茶凳，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,306評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望播揪。院中可真熱鬧贮喧，春花似錦、人聲如沸猪狈。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,898評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽雇庙。三九已至谓形，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間疆前，已是汗流浹背寒跳。一陣腳步聲響...
開封第一講書人閱讀 33,019評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留竹椒，地道東北人童太。一個(gè)月前我還...
沈念sama閱讀 48,138評論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像胸完，于是被迫代替她去往敵國和親书释。傳聞我的和親對象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,927評論 2贊 355