你的 ResNet 是時(shí)候更新了 —— ResNeSt 來也舀奶！

Date: 2020/04/30 夜晚 ~?2020/05/01 凌晨

Author: CW

前言：

趕在月末暑竟，終于有時(shí)間寫文了，最近工作上需求比較急育勺，抽不出時(shí)間來簡(jiǎn)書更文但荤，但我心早已狂熱！在我敲上這行字的時(shí)候涧至，真的很開心腹躁，因?yàn)檎嫘暮芟硎苓@種靜靜地碼字向別人分享學(xué)習(xí)心得的時(shí)光（雖然不知道有沒有人看..）。OK南蓬，廢話不多說纺非，如今就為大家奉上這個(gè)新鮮出爐的新品 —— ResNeSt！

你沒看錯(cuò)赘方，是 ResNeSt 而不是 ResNet 喲烧颖！這是張航、李沐等大佬創(chuàng)造的 ResNet 改進(jìn)版窄陡，在參數(shù)量沒有顯著增加的情況下顯著提升了性能炕淮，并且可以很方便地如 ResNet 般集成到現(xiàn)有模型中。通過本文泳梆，我們就一起來看看它有多香吧鳖悠！

此處附上?Paper?&?源碼

Outline

I. 主要思想

II. 分組的通道注意力機(jī)制：Split-Attention

III. 從代碼出發(fā)，知行合一

主要思想

ResNeSt 很好懂优妙，不復(fù)雜，簡(jiǎn)單來說就是結(jié)合了 ResNeXt 的分組卷積和 SE-Net 的通道注意力機(jī)制憎账，將通道進(jìn)行分組套硼，對(duì)每組運(yùn)用注意力機(jī)制，同時(shí)保留了 ResNet 的殘差結(jié)構(gòu)胞皱。

分組的通道注意力機(jī)制：Split-Attention

SplAtConv2d

這部分我們來詳談分組的通道注意力是怎樣一種操作邪意，作者論述到可能的實(shí)現(xiàn)方式有多種，這里我先談?wù)勂渲幸环N反砌。

了解 ResNeXt 的朋友們都知道雾鬼，其引入了 Cardinality 的概念，代表分組的組數(shù)宴树，為方便敘述策菜，這里記為 K；ResNeSt 則在此基礎(chǔ)上進(jìn)一步分組，稱為 split 操作又憨，同時(shí)引入一個(gè)超參 Radix翠霍，代表將 K 個(gè)組中的每一個(gè)進(jìn)一步劃分的組數(shù)，這里記為 R蠢莺。這里的分組都是在通道這個(gè)維度上進(jìn)行寒匙，由此看來，就是將輸入在通道這個(gè)維度劃分為 KxR 個(gè)組躏将。

分組完畢后锄弱，對(duì)每個(gè)組實(shí)施不同的特征變換（Conv+Bn+Relu 等），然后將它們分成 R 份祸憋，這樣每份就包含原來的 K 個(gè)組棵癣，對(duì)每一份應(yīng)用投票機(jī)制形成注意力（Softmax or Sigmoid），接著將這 R 份注意力與特征圖對(duì)應(yīng)相乘（element-wise multiply）夺衍，最后將這 R 份結(jié)果加起來（element-wise sum）形成輸出狈谊，輸出相當(dāng)于對(duì)應(yīng)了原來的 K 個(gè)組。

梳理下沟沙，可以知道注意力在是分了 K 個(gè)組后再分R個(gè)組上執(zhí)行的河劝，記 R 中的每一份為 r，K 中的每一份為k矛紫，那么每個(gè) r 上得到的注意力是不同的赎瞎，即每個(gè) k split 下的每個(gè) r 上的注意力不同，而同一個(gè) r 下對(duì)應(yīng)的不同 k 的注意力是一致的颊咬。

很奇妙务甥，對(duì)于分得的K個(gè)組，每個(gè)組內(nèi)切分R份分配不同的注意力喳篇，但不同組依次對(duì)應(yīng)的這R份注意力卻分別是一致的敞临，是謂同又不盡全同！

從代碼出發(fā)麸澜，知行合一

看過 paper 和源碼的朋友們可能會(huì)一頭霧水挺尿，paper 中展示的結(jié)構(gòu)圖和代碼實(shí)現(xiàn)的有出入，一開始 CW 也是如此炊邦，看了幾篇文但總感覺自己理解得依舊不那么清晰编矾，于是乎親自把代碼手?jǐn)]一遍，并結(jié)合畫圖理解馁害，最終眼前的迷霧也就散開了窄俏。

我國古代優(yōu)秀大佬王陽明推崇知行合一，雖然凡事不一定硬要知行結(jié)合碘菜，但是吾以為有了認(rèn)知才有“行”的方向凹蜈，“行”了才能加深認(rèn)知或者說真正認(rèn)知限寞，這是一個(gè)循環(huán)，最終達(dá)到合二為一的高手境界踪区。

(⊙o⊙)… sorry昆烁，裝b裝過頭了，接下來進(jìn)入正題缎岗。

作者在源碼中對(duì)于 split attention 使用了兩個(gè)類對(duì)應(yīng)兩種實(shí)現(xiàn)方式静尼，其中一個(gè)類為 SplAtConv2d，對(duì)應(yīng)于上一部分展示的圖中結(jié)構(gòu)传泊；另一個(gè)類為 RadixMajorNaiveImp鼠渺，對(duì)應(yīng)下圖中的結(jié)構(gòu)。

RadixMajorNaiveImp

結(jié)合上圖和代碼眷细，先來看看 RadixMajorNaiveImp 具體如何實(shí)現(xiàn)拦盹。

首先將輸入分為 KxR 個(gè)組，然后依次對(duì)K中的每個(gè) k 執(zhí)行注意力機(jī)制溪椎，具體做法是取出同一個(gè) k 下的所有 r普舆，然后把它們加起來，輸入全局平均池化層和兩層全連接層校读。

RadixMajorNaiveImp (i)

接著令通道這個(gè)維度等于 R沼侣，在這個(gè)維度上生成注意力權(quán)重，同時(shí)歉秫，將同一 k 下的所有 r 在通道這個(gè)維度上拼接起來蛾洛，與注意力權(quán)重相乘，相乘后的結(jié)果分為 R 份雁芙，將這 R 份結(jié)果加起來形成這一個(gè) k 的輸出轧膘，最終將K組中所有 k 的結(jié)果在通道數(shù)這個(gè)維度上拼接起來。

RadixMajorNaiveImp (ii)

總的來說兔甘，這種方式就是依次對(duì) K 組中的每份 k 進(jìn)行處理谎碍，每份 k 進(jìn)一步 split 成 R 份，其中每份 r 生成不同的注意力裂明，K 組中的每份 k 都結(jié)合完注意力后椿浓，再將它們的結(jié)果在通道上拼接起來。

SplAtConv2d

接下來看看 SplAtConv2d 的實(shí)現(xiàn)方式闽晦。

SplAtConv2d

仔細(xì)觀察上圖，我們可以發(fā)現(xiàn)提岔，這種實(shí)現(xiàn)方式是將輸入分為 R 份仙蛉，其中的每份 r 包含了 K 個(gè)組，每份 r 生成的注意力不同（對(duì)應(yīng)上圖中的虛線框）碱蒙，上一節(jié)便說到了荠瘪，同一 k 下不同的 split r 上形成的注意力不一致夯巷，但不同的 k 對(duì)應(yīng)相同的 r 上形成的注意力卻是一致的。

再回顧下 RadixMajorNaiveImp 的實(shí)現(xiàn)方式哀墓，同一 k 下不同的 split r 上形成的注意力也是不一致趁餐，但不同 k 的注意力是獨(dú)立生成的，它們之間并沒有聯(lián)系篮绰，這就是兩種實(shí)現(xiàn)方式的最大差別了后雷。

一起來瞄瞄代碼~

SplAtConv2d (i)

這里提醒大家注意下，訓(xùn)練過程中在測(cè)試這個(gè)模塊時(shí)吠各，記住把 batch size 設(shè)置大于1臀突，由于使用了 global average pooling，輸出特征的大小變?yōu)?x1贾漏，因此其后接 bn 的話（上圖中 self.bn1）就要求每個(gè)通道上多于一個(gè)元素候学，而如果 batch size 為1的話就會(huì)報(bào)錯(cuò)了：

ValueError: Expected more than 1 value per channel when training

bn 是在每個(gè)通道上（channel-wise）做歸一化的，如果通道上只有1個(gè)元素纵散，那么歸一化就無意義了梳码，所以在訓(xùn)練過程中， bn 要求每個(gè)通道上必須多于1個(gè)元素伍掀。

SplAtConv2d (ii)

另外掰茶，SplAtConv2d 這種實(shí)現(xiàn)方式不需要依次對(duì) K 組中的每份進(jìn)行處理，而是直接對(duì) K 個(gè)組同時(shí)進(jìn)行處理硕盹，相比于 RadixMajorNaiveImp 的方式更加簡(jiǎn)潔些符匾。

作者在 paper 和 github 源碼中也給出了兩者等價(jià)性的證明，源碼可以看這里：

SplAtConv2d 和 RadixMajorNaiveImp 的等價(jià)性證明

另外還可參考?Amusi (CVer) 的這篇文：

ResNeSt 實(shí)現(xiàn)有誤瘩例？

最后：

對(duì)于 ResNeSt啊胶， 初次接觸時(shí)往往會(huì)感覺其代碼實(shí)現(xiàn)和paper描述得有出入，因此要把它講述明白垛贤，自己本身一定要理解得透徹焰坪。如果沒有親自敲過一遍代碼，就很難做到聘惦。對(duì)于其它算法模型也一樣某饰，能真正掌握的辦法就是親自上陣實(shí)踐一番，所謂知而不行善绎，乃是未知黔漂。

最后編輯于：2020.10.25 10:38:56

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

禁止轉(zhuǎn)載，如需轉(zhuǎn)載請(qǐng)通過簡(jiǎn)信或評(píng)論聯(lián)系作者禀酱。

人面猴
序言：七十年代末炬守，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子剂跟，更是在濱河造成了極大的恐慌减途，老刑警劉巖酣藻，帶你破解...
沈念sama閱讀 221,576評(píng)論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異鳍置，居然都是意外死亡辽剧，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,515評(píng)論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門税产，熙熙樓的掌柜王于貴愁眉苦臉地迎上來怕轿，“玉大人，你說我怎么就攤上這事砖第〕仿” “怎么了？”我有些...
開封第一講書人閱讀 168,017評(píng)論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵梧兼，是天一觀的道長(zhǎng)放吩。經(jīng)常有香客問我，道長(zhǎng)羽杰，這世上最難降的妖魔是什么渡紫？我笑而不...
開封第一講書人閱讀 59,626評(píng)論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮考赛，結(jié)果婚禮上惕澎，老公的妹妹穿的比我還像新娘。我一直安慰自己颜骤，他們只是感情好唧喉，可當(dāng)我...
茶點(diǎn)故事閱讀 68,625評(píng)論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著忍抽，像睡著了一般八孝。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上鸠项，一...
開封第一講書人閱讀 52,255評(píng)論 1贊 308
城市分裂傳說
那天干跛，我揣著相機(jī)與錄音，去河邊找鬼祟绊。笑死楼入，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的牧抽。我是一名探鬼主播嘉熊，決...
沈念sama閱讀 40,825評(píng)論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼扬舒！你這毒婦竟也來了记舆？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,729評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤呼巴，失蹤者是張志新（化名）和其女友劉穎泽腮，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體衣赶，經(jīng)...
沈念sama閱讀 46,271評(píng)論 1贊 320
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡诊赊，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,363評(píng)論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了府瞄。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片碧磅。...
茶點(diǎn)故事閱讀 40,498評(píng)論 1贊 352
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖遵馆，靈堂內(nèi)的尸體忽然破棺而出鲸郊，到底是詐尸還是另有隱情，我是刑警寧澤货邓，帶...
沈念sama閱讀 36,183評(píng)論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布秆撮，位于F島的核電站，受9級(jí)特大地震影響换况，放射性物質(zhì)發(fā)生泄漏职辨。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,867評(píng)論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一戈二、第九天我趴在偏房一處隱蔽的房頂上張望舒裤。院中可真熱鬧，春花似錦觉吭、人聲如沸腾供。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,338評(píng)論 0贊 24
一樁弒父案鲜滩，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽伴鳖。三九已至，卻和暖如春绒北，著一層夾襖步出監(jiān)牢的瞬間黎侈，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,458評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工闷游，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留峻汉，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,906評(píng)論 3贊 376
代替公主和親
正文我出身青樓脐往，卻偏偏與公主長(zhǎng)得像休吠，于是被迫代替她去往敵國和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子业簿，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,507評(píng)論 2贊 359