LESA可以讓你的低計(jì)算力模型也可以有局部信息和上下文信息

01?簡 介

在計(jì)算機(jī)視覺模型中搬素,Self-Attention已經(jīng)成為一種普遍模塊绷耍。盡管它取得了顯著的成就,但對Self-Attention的理解仍然有限忽刽。它的優(yōu)點(diǎn)之一是克服了空間距離對依賴性建模的限制天揖。

與LSTM和門控RNN相比,Self-Attention源于自然語言處理跪帝,在不考慮序列中單詞之間距離的情況下對遠(yuǎn)距離依賴關(guān)系進(jìn)行建模今膊。

在應(yīng)用于視覺模型時(shí),Self-Attention將像素或Patch之間的全局信息聚集起來伞剑。同樣斑唬,與傳統(tǒng)的卷積相比,通過Self-Attention提取的特征不再受局部鄰域的約束黎泣。

而LTSA作者認(rèn)為恕刘,Self-Attention中的全局聚合也會(huì)帶來問題,因?yàn)榫酆系奶卣鞑荒芮宄貐^(qū)分local cues和contextual cues抒倚。

作者從條件隨機(jī)場(CRF)的角度來研究這個(gè)問題褐着,并將其分解為local term和context term。而unary term(Local)和binary term(Context)則基于相同的query托呕、key和value構(gòu)建塊含蓉,并使用相同的投影矩陣計(jì)算。

假設(shè)项郊,使用相同的構(gòu)建模塊的local term和context term將導(dǎo)致問題馅扣,這與Dong等人指出的Self-Attention映射的弱點(diǎn)有關(guān)。

他們從理論上證明了連續(xù)Self-Attention的輸出會(huì)以雙指數(shù)形式收斂到一個(gè)秩1矩陣着降,并從經(jīng)驗(yàn)上驗(yàn)證了這種退化差油。他們還聲稱skip connection可以部分解決排序崩潰問題。

在作者的CRF分析中任洞,skip connection創(chuàng)建了最簡單的local term蓄喇,這相當(dāng)于標(biāo)識(shí)映射食绿。雖然skip connection緩解了這個(gè)問題,但作者認(rèn)為仍然需要設(shè)計(jì)一個(gè)具有更強(qiáng)表示能力的Local term公罕。

02?本文方法

對于提升Local Term的表征能力器紧,作者受全連接條件隨機(jī)場(CRF)的啟發(fā),將自注意力分解為Local term和Context term楼眷。它們對應(yīng)于CRF中的unary term和binary term铲汪,并由投影矩陣的注意力機(jī)制實(shí)現(xiàn)。

作者發(fā)現(xiàn)罐柳,unary term對輸出的貢獻(xiàn)很小掌腰,而標(biāo)準(zhǔn)的CNN僅依賴于unary term,在各種任務(wù)上都取得了很好的性能张吉。

因此齿梁,作者提出了局部增強(qiáng)的自注意力機(jī)制(LESA),它通過將unary term與卷積結(jié)合來增強(qiáng)unary term肮蛹,并利用融合模塊動(dòng)態(tài)耦合unary和binary運(yùn)算勺择。

1.分解Self-Attention

可以將Self-Attention分解為Local term和Context term。

具體來說伦忠,可以將Self-Attention的公式寫成:

對于空間位置(i,j)省核,第一個(gè)Local term通過觀察自身來計(jì)算激活,而第二個(gè)Context term通過觀察他人來計(jì)算激活昆码,然后由softmax來生成貢獻(xiàn)權(quán)重气忠。

因此,輸出混合了局部和上下文特征赋咽。

作者進(jìn)行消融實(shí)驗(yàn)研究旧噪,以調(diào)查這兩個(gè)term的貢獻(xiàn)。具體來說脓匿,采用ResNet50淘钟,并將其最后兩個(gè)階段的卷積層替換為Self-Attention。

可以看到亦镶,Self-Attention主要是由Binary運(yùn)算貢獻(xiàn)的日月,但Unary也很重要袱瓮。雖然Unary項(xiàng)的權(quán)值只取小于2%缤骨,去除它會(huì)導(dǎo)致7.56%的準(zhǔn)確率下降或35%的錯(cuò)誤率相對增加。

通過這種分解方法分析Self-Attention時(shí)尺借,Unary項(xiàng)起著重要作用绊起,但大部分的計(jì)算和重點(diǎn)都集中在Binary運(yùn)算上。

2.?局部增強(qiáng)Self-Attention

添加Unary項(xiàng)和Binary項(xiàng)是一種靜態(tài)的方法燎斩,可以用相等的權(quán)重合并這兩個(gè)項(xiàng)虱歪。更靈活的策略是在不同的情況下給兩者分配權(quán)重蜂绎。

例如,在目標(biāo)檢測中笋鄙,當(dāng)檢測圖像中的多個(gè)小目標(biāo)時(shí)师枣,像素依賴的局部性比上下文更重要。

具體來說萧落,和Sigmoid一起可以將pipeline表示為F+Sigmoid(BN - ReLU - FC - BN - ReLU - FC - BN - Sigmoid)践美。為簡單起見,在公式中省略了位置嵌入找岖。

在設(shè)計(jì)中陨倡,w根據(jù)Unary項(xiàng)和Binary項(xiàng)的內(nèi)容,在不同的空間位置和不同的特征通道中控制它們的相對權(quán)重许布。

3.Unary和Binary Terms的動(dòng)態(tài)融合

添加Unary項(xiàng)和Binary項(xiàng)是合并具有相等權(quán)重的2個(gè)項(xiàng)的靜態(tài)方式兴革。更靈活的策略是在不同情況下按需分配權(quán)重。例如蜜唾,在目標(biāo)檢測中杂曲,當(dāng)檢測圖像中的多個(gè)小目標(biāo)時(shí),像素依賴的局部性比上下文更重要袁余。

這里作者通過將Binary項(xiàng)乘以并自適應(yīng)調(diào)整這2項(xiàng)的相對權(quán)重解阅,如下式所示:

具體來說,和Sigmoid可以表示為:

在設(shè)計(jì)中泌霍,ω取決于Unary項(xiàng)和Binary項(xiàng)的內(nèi)容货抄,并控制它們在不同空間位置和不同特征通道中的相對權(quán)重。這是融合Unary項(xiàng)和Binary項(xiàng)的主要方式朱转。

03?實(shí)驗(yàn)

1.圖像分類

結(jié)果如表所示蟹地。準(zhǔn)確度top-1和top-5中,LESA都超過了卷積和Self-Attention的Baseline藤为。

動(dòng)態(tài)融合模塊使用等式中的w來控制Binary項(xiàng)怪与。則Unary項(xiàng)和Binary項(xiàng)的權(quán)值分別為1+w和w/1+w。由于w依賴于輸入缅疟、空間位置和特征通道分别,在記錄中對它們的權(quán)重進(jìn)行平均。

在自注意中存淫,通過表1中使用的softmax操作計(jì)算權(quán)重耘斩。研究發(fā)現(xiàn),Self-Attention中權(quán)重分布是不平衡的桅咆。Unary項(xiàng)的權(quán)重百分比小于3%括授,比Binary項(xiàng)的權(quán)重百分比小32倍以上。

而對于LESA,它們的權(quán)重百分比分別為67%和33%荚虚。在局部線索尤為重要的目標(biāo)檢測任務(wù)中薛夜,LESA表現(xiàn)出了更好的提高,如表3和表4所示版述。

2.目標(biāo)檢測與實(shí)例分割

結(jié)果如表3和表4所示梯澜。對val2017和test-dev2017使用相同的測試。與所有場景中的卷積渴析、Self-Attention和DCN Baseline相比腊徙,LESA為所有小、中檬某、大目標(biāo)提供了最好的BBox mAP和Mask mAP撬腾。

3.結(jié)果對比

通過上圖可以看出,LESA的效果明顯優(yōu)于CNN和Self-Attention恢恼。

04?總結(jié)

這項(xiàng)工作主要啟發(fā)點(diǎn)是來自于條件隨機(jī)場民傻,從CRF的角度將Self-Attention分解為一階和二階項(xiàng),也就是文中所謂的Unary Term和Binary Term场斑。

對于局部信息和全局信息所對應(yīng)的Local Feature和Global Feature的關(guān)注在之前的各種工作中都沒有得到很好的平衡漓踢;

因此作者針對于這一點(diǎn)提出了自己的觀點(diǎn)設(shè)計(jì)了全新的局部信息增強(qiáng)模塊,也就是LESA注意力機(jī)制漏隐,首先是通過Unary Term與卷積相結(jié)合來增強(qiáng)模型局部信息的表達(dá)能力喧半,

其次,提出了動(dòng)態(tài)化的融合Unary Term和Binary Term青责,進(jìn)而可以更好的讓該模塊適配于不同的下游任務(wù)挺据,比如說針對檢測任務(wù),尤其是其中的小目標(biāo)脖隶,這時(shí)的局部信息就顯得格外的重要扁耐,而針對于分類任務(wù),可能全局信息更為重要产阱,可見動(dòng)態(tài)融合這方面還是一個(gè)不錯(cuò)的Trick的婉称。

但是LESA與標(biāo)準(zhǔn)的Self-Attention一樣,都具有會(huì)消耗大量內(nèi)存的問題构蹬。因?yàn)檫@些計(jì)算量都是由于query與key計(jì)算相似度矩陣多帶來了王暗。目前也有很多工作在嘗試解決這個(gè)問題。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末庄敛,一起剝皮案震驚了整個(gè)濱河市俗壹,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌铐姚,老刑警劉巖策肝,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異隐绵,居然都是意外死亡之众,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進(jìn)店門依许,熙熙樓的掌柜王于貴愁眉苦臉地迎上來棺禾,“玉大人,你說我怎么就攤上這事峭跳”焐簦” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵蛀醉,是天一觀的道長悬襟。 經(jīng)常有香客問我,道長拯刁,這世上最難降的妖魔是什么脊岳? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮垛玻,結(jié)果婚禮上割捅,老公的妹妹穿的比我還像新娘。我一直安慰自己帚桩,他們只是感情好亿驾,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著账嚎,像睡著了一般莫瞬。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上郭蕉,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天乏悄,我揣著相機(jī)與錄音,去河邊找鬼恳不。 笑死檩小,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的烟勋。 我是一名探鬼主播规求,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼卵惦!你這毒婦竟也來了阻肿?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤沮尿,失蹤者是張志新(化名)和其女友劉穎丛塌,沒想到半個(gè)月后较解,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡赴邻,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年印衔,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片姥敛。...
    茶點(diǎn)故事閱讀 39,977評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡奸焙,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出彤敛,到底是詐尸還是另有隱情与帆,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布墨榄,位于F島的核電站玄糟,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏袄秩。R本人自食惡果不足惜茶凳,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望播揪。 院中可真熱鬧贮喧,春花似錦、人聲如沸猪狈。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽雇庙。三九已至谓形,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間疆前,已是汗流浹背寒跳。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留竹椒,地道東北人童太。 一個(gè)月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像胸完,于是被迫代替她去往敵國和親书释。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容