Refinedet 網絡解析

refinedet 論文筆記:
http://www.reibang.com/p/5504f4188d52

? ? ? ?紙上學來終覺淺并扇,繼上次讀完Refinedet論文后嘶窄,理論上理解了其中的原理,后面主要花了些功夫閱讀了源碼障贸,理解整個網絡的數據流程擂错。


image.png

? ? ? ?照例先上論文中的架構圖本鸣,在此我對里面做了一些標注


image.png

上面是ARM里4個特征圖的Size,左邊為320x320壮莹,右邊為512x512的原圖像輸入

網絡改動的地方翅帜,是在VGG16的"pool5"之后,添加了conv fc6命满,conv fc7涝滴,conv6_1以及conv6_2,還有ODM的[P6, P5, P4, P3], 其中

ARM部分

--conv fc6

通過在"pool5"上做了atrous convolution胶台,kernel_size = 3x3,stride = 3 , channel = 1024,其中stride=3指在map上兩兩相隔3-1=2 個步長歼疮,輸出的大小不變,channel為1024诈唬,見下圖即可明白:

1.應該同樣存在信息損失的情況韩脏,傳統(tǒng)conv如果stride為1,則會有一部分重疊铸磅,而dilation conv極大減少這點
2.主要為了在不損失信息的情況下增大感受野赡矢,而擴大conv的尺寸也可以,但參數會變得更多阅仔,而且conv的增大和感受野的增大是線性吹散,但dilation conv和感受野是指數增長

image.png

--conv fc7

在"conv fc6"之后做了kernel_size = 1x1,stride = 1 , channel = 1024的卷積操作,形狀與conv fc6 保持一致

--conv6_1

繼"conv fc7"之后八酒,做了kernel_size = 1x1,stride = 1 , channel = 256的卷積操作空民,size不變,channel為256

--conv6_2

"conv6_1"之后丘跌,kernel_size = 3x3,stride = 2 , channel = 512的卷積操作袭景,也就是說把尺寸縮小一半了,channel變成512

ODM部分

ODM部分主要通過TCB模塊轉換而成闭树,回顧一下TCB的流程:

image.png

Input (上方的箭頭)為ARM[conv 4_3耸棒,conv5_3,conv fc7报辱,conv6_2]与殃,輸出分別對應了ODM[P3, P4, P5, P6]
deconv這一步,傳入的實際是[P4 , P5 , P6],
根據網絡的架構圖幅疼,我們不難看出米奸,P6 是 首先生成的,而conv6_2的輸出已經是最高的feature map所以在conv6_2 到 P6 的TCB爽篷,沒有deconv這個操作(如下圖所示)
image.png

-- P6

因為是最高層的輸出悴晰,所以沒有deconv操作,自然也就沒Elte sum逐工,實際就是feature map經過3個kernel_size = 3x3,stride =1 , channel = 256铡溪,以及relu的卷積操作,size不變泪喊,channel 為 256

-- P5

與"P6"不同棕硫,TCB 有了deconv的輸入,就是P6袒啼。(P3,P4同理)
"conv fc7" 輸出的feature map 先經過一個 conv-relu和一個 conv 之后哈扮,再和 deconv后的P6 進行eltw_sum操作,而后接了一個relu蚓再,最后就是一個con_relu操作滑肉,從而得到P5

值得一提的是,TCB里的deconv对途,是把size加倍

-- P4 P3

原理一樣赦邻,看P5和 P6 即可明白

有一個細節(jié)就是當conv4_3,conv5_3層在做anchor 的預測亦或者是做TCB操作的時候為了防止反向傳播的剃度過大導致loss輸出nan实檀,這兩層會經過一個L2normlization操作然后分別擴大常量倍數惶洲,scale的值分別為10和8

ARM和ODM的feature map之后,執(zhí)行了類似的卷積操作膳犹。

ARM:1.kernel_size = 3x3, stride = 1 ,channel = num_anchor?4(坐標回歸)
? ? ? ????? 2.kernel_size = 3x3, stride = 1 ,channel = num_anchor?2(判斷前后景)

ODM:1.kernel_size = 3x3, stride = 1 ,channel = num_anchor?4(坐標回歸)
? ? ? ????? 2.kernel_size = 3x3, stride = 1 ,channel = num_anchor?num_cls(分類)

關于anchor

正樣本:選取IOU最大的一個anchor恬吕,以及剩下的IO>0.5的作為所有正樣本
負樣本:

這里開始對論文的理解不太深,不知道是自己理解問題還是作者表達不太清楚须床,現在可以可以總結出:
1.過濾掉所有負置信度>0.99的anchor铐料,換而言之,就是去掉很明顯就能判斷出是背景的anchor豺旬,如果保留了這些钠惩,模型能很快而且輕松的學到把anchor判斷為背景,這樣反而是不好的族阅,學習過程過于簡單而且快篓跛,模型的理解能力會很差。
2.相反坦刀,我們需要的是誤判為物品的anchor愧沟,分數越高蔬咬,證明偏差越大,把這些負樣本送進網絡訓練沐寺,告知模型難以判斷的錯誤林艘,能學習到更復雜的情況和更好的效果,總而言之就是讓模型盡可能學到更多混坞。
3.貌似在2的時候狐援,ARM并沒有把低分的score(誤判的)過濾掉,而是一起送進ODM拔第,最后ODM再結合loss計算把這些過濾掉

總體來說咕村,ARM中先第一次調整anchor的位置、尺度蚊俺,使之為ODM提供修正后的anchor;整體操作方式與RPN類似逛万,在參與預測的feature map每個位置上泳猬,密集采樣 n 個anchors,每個anchor的尺度宇植、長寬比是預定義好的得封,位置也是相對固定的;ARM就相當于RPN操作指郁,為每個anchor預測其相對位置偏置(relative offsets忙上,也即,對anchor原始位置的相對位移)闲坎,并預測每個anchor的objectness二分類得分疫粥,那么最終就得到了 n 個調整后的anchor,當然了腰懂,并不是所有anchor都被判定為包含目標梗逮,ARM就只需要篩選判別為目標的anchor,走下一步ODM的流程绣溜;
得到ARM調整的anchor之后慷彤,利用TCB得到anchor在feature map上新的特征,并在ODM上進一步實施類似SSD的操作怖喻,預測bbox的位置底哗、大小、具體類別等锚沸;操作就跟SSD很像了跋选,ARM、ODM上feature map的尺度一致咒吐,對ARM中每個判定為object的1-stage refined anchor野建,進一步輸出 C 類得分 + 2-stage refined anchor(也即4個坐標offsets)属划,輸出也與SSD保持一致,每個anchor對應C + 4維的輸出候生;

更多細節(jié)的東西以后再更

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末同眯,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子唯鸭,更是在濱河造成了極大的恐慌须蜗,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,695評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件目溉,死亡現場離奇詭異明肮,居然都是意外死亡,警方通過查閱死者的電腦和手機缭付,發(fā)現死者居然都...
    沈念sama閱讀 94,569評論 3 399
  • 文/潘曉璐 我一進店門柿估,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人陷猫,你說我怎么就攤上這事秫舌。” “怎么了绣檬?”我有些...
    開封第一講書人閱讀 168,130評論 0 360
  • 文/不壞的土叔 我叫張陵足陨,是天一觀的道長。 經常有香客問我娇未,道長墨缘,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,648評論 1 297
  • 正文 為了忘掉前任零抬,我火速辦了婚禮镊讼,結果婚禮上,老公的妹妹穿的比我還像新娘媚值。我一直安慰自己狠毯,他們只是感情好,可當我...
    茶點故事閱讀 68,655評論 6 397
  • 文/花漫 我一把揭開白布褥芒。 她就那樣靜靜地躺著嚼松,像睡著了一般。 火紅的嫁衣襯著肌膚如雪锰扶。 梳的紋絲不亂的頭發(fā)上献酗,一...
    開封第一講書人閱讀 52,268評論 1 309
  • 那天,我揣著相機與錄音坷牛,去河邊找鬼罕偎。 笑死,一個胖子當著我的面吹牛京闰,可吹牛的內容都是我干的颜及。 我是一名探鬼主播甩苛,決...
    沈念sama閱讀 40,835評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼俏站!你這毒婦竟也來了讯蒲?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,740評論 0 276
  • 序言:老撾萬榮一對情侶失蹤肄扎,失蹤者是張志新(化名)和其女友劉穎墨林,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體犯祠,經...
    沈念sama閱讀 46,286評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡旭等,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,375評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了衡载。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片搔耕。...
    茶點故事閱讀 40,505評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖痰娱,靈堂內的尸體忽然破棺而出度迂,到底是詐尸還是另有隱情,我是刑警寧澤猜揪,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站坛梁,受9級特大地震影響而姐,放射性物質發(fā)生泄漏。R本人自食惡果不足惜划咐,卻給世界環(huán)境...
    茶點故事閱讀 41,873評論 3 333
  • 文/蒙蒙 一拴念、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧褐缠,春花似錦政鼠、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,357評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至胡桨,卻和暖如春官帘,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背昧谊。 一陣腳步聲響...
    開封第一講書人閱讀 33,466評論 1 272
  • 我被黑心中介騙來泰國打工刽虹, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人呢诬。 一個月前我還...
    沈念sama閱讀 48,921評論 3 376
  • 正文 我出身青樓涌哲,卻偏偏與公主長得像胖缤,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子阀圾,可洞房花燭夜當晚...
    茶點故事閱讀 45,515評論 2 359

推薦閱讀更多精彩內容