Models in CV

Backbone Models

1. Inception


Version 1

模型特點(diǎn):

  1. 采用<u>不同大小的卷積核意味著不同大小的感受野竖席,最后拼接意味著不同尺度特征的融合</u>;
  2. 之所以卷積核大小采用1杉编、3和5秦效,主要是為了方便對(duì)齊礁竞。<u>設(shè)定卷積步長stride=1之后,只要分別設(shè)定pad=0靖苇、1滴劲、2,那么卷積之后便可以得到相同維度的特征顾复,然后這些特征就可以直接拼接在一起了</u>班挖;
  3. 文章說很多地方都表明pooling挺有效,所以Inception里面也嵌入了芯砸。
  4. 網(wǎng)絡(luò)越到后面萧芙,特征越抽象,而且每個(gè)特征所涉及的感受野也更大了假丧,因此隨著層數(shù)的增加双揪,3x3和5x5卷積的比例也要增加。

但是包帚,<u>使用5x5的卷積核仍然會(huì)帶來巨大的計(jì)算量</u>渔期。 為此,文章借鑒NIN2,采用1x1卷積核來進(jìn)行降維疯趟。

例如:上一層的輸出為100x100x128拘哨,經(jīng)過具有256個(gè)輸出的5x5卷積層之后(stride=1,padding=2)信峻,輸出數(shù)據(jù)為100x100x256倦青。其中,卷積層的參數(shù)為128x5x5x256盹舞。假如上一層輸出先經(jīng)過具有32個(gè)輸出的1x1卷積層产镐,再經(jīng)過具有256個(gè)輸出的5x5卷積層,那么最終的輸出數(shù)據(jù)仍為為100x100x256踢步,但卷積參數(shù)量已經(jīng)減少為128x1x1x32 + 32x5x5x256癣亚,大約減少了4倍。

Inception Block結(jié)構(gòu):

[圖片上傳失敗...(image-7d0877-1548856862938)]

模型結(jié)構(gòu):

[圖片上傳失敗...(image-c123b9-1548856862938)]


Version 2

模型改進(jìn):

  1. 使用BN層获印,將每一層的輸出都規(guī)范化到一個(gè)N(0,1)的正態(tài)分布述雾,這將有助于訓(xùn)練,因?yàn)橄乱粚?strong><u>不必學(xué)習(xí)輸入數(shù)據(jù)中的偏移蓬豁,并且可以專注與如何更好地組合特征</u>(也因?yàn)樵趘2里有較好的效果,BN層幾乎是成了深度網(wǎng)絡(luò)的必備)菇肃;<u>BN層能夠提升模型的訓(xùn)練速度</u>

Inception Block結(jié)構(gòu):

[圖片上傳失敗...(image-ea7142-1548856862938)]

Result on ImageNet:

[圖片上傳失敗...(image-1acbac-1548856862938)]

Version 4

Inception Block:

[圖片上傳失敗...(image-d6d2d6-1548856862938)]

Conclusion:

  • Inception網(wǎng)絡(luò)模式人工痕跡太重地粪,模型太復(fù)雜。容易過擬合琐谤。
  • 模式屬于split-transform-merge模式蟆技,每一路通道進(jìn)行單獨(dú)轉(zhuǎn)換,最后所有通道concate(級(jí)聯(lián))
  • 版本越往后面參數(shù)越多斗忌,訓(xùn)練所花費(fèi)的時(shí)間和資源越多

2. ResNet


3. ResNext


模型特點(diǎn):

  1. 在ResNet模型的基礎(chǔ)上增加了Residual Block的寬度(通道)质礼,檢驗(yàn)了模型寬度所帶來的精度提升。
  2. 最后所有通道僅僅是相加起來便可以融合织阳。符合split-transform-merge模式
  3. 進(jìn)一步驗(yàn)證了split-transform-merge模式的普遍性和有效性

ResNext Block:

img
  • 左ResNet 右ResNext(32 Paths)
img
  • a為基本的ResNext Block單元
  • 如果將最后1x1的合并到一起眶蕉,等價(jià)于網(wǎng)絡(luò)b中擁有和Inception-ResNet的結(jié)構(gòu)(concate)
  • 進(jìn)一步將輸入的1x1合并,等價(jià)于網(wǎng)絡(luò)c中和通道分組卷積網(wǎng)絡(luò)結(jié)構(gòu)類似

Conclusion:

  • ResNext-101 (32x4d)大小和Inception v4相當(dāng)唧躲,精度略差造挽。但是訓(xùn)練速度快很多
  • ResNext-101 (64x4d)大小和Inception-ResNet大一點(diǎn),精度相當(dāng)或略差弄痹,速度快非常多
  • 結(jié)構(gòu)簡單饭入,可以防止對(duì)特定數(shù)據(jù)集的過擬合。

4. VGG

模型特點(diǎn)

  1. 整個(gè)網(wǎng)絡(luò)都使用了同樣大小的卷積核尺寸(3 x 3)和最大池化尺寸(2 x 2)
  2. 1 x 1卷積的意義主要在于線性變換肛真,而輸入通道數(shù)和輸出通道數(shù)不變谐丢,沒有發(fā)生降維。
  3. 兩個(gè)3 x 3的卷積層串聯(lián)相當(dāng)于1個(gè)5 x 5的卷積層,即一個(gè)像素會(huì)跟周圍5 x 5的像素產(chǎn)生關(guān)聯(lián)乾忱,可以說感受野大小為5 x 5讥珍。而3個(gè)3 x 3的卷積層串聯(lián)的效果則相當(dāng)于1個(gè)7 x 7的卷積層。除此之外饭耳,3個(gè)串聯(lián)的3 x 3的卷積層串述,擁有比1個(gè)7 x 7的卷積層更少的參數(shù)量,只有后者的(3 x 3 x 3)/(7 x 7)=55%寞肖。最重要的是纲酗,3個(gè)3 x 3的卷積層擁有比1個(gè)7 x 7的卷積層更多的非線性變換(前者可以使用三次ReLU激活函數(shù),而后者只有一次)新蟆,使得CNN對(duì)特征的學(xué)習(xí)能力更強(qiáng)觅赊。
  4. VGGNet在訓(xùn)練時(shí)有一個(gè)小技巧,先訓(xùn)練級(jí)別A的簡單網(wǎng)絡(luò)琼稻,再復(fù)用A網(wǎng)絡(luò)的權(quán)重來初始化后面的幾個(gè)復(fù)雜模型吮螺,這樣訓(xùn)練收斂的速度更快。在預(yù)測時(shí)帕翻,VGG采用Multi-Scale的方法鸠补,將圖像scale到一個(gè)尺寸Q,并將圖片輸入卷積網(wǎng)絡(luò)計(jì)算嘀掸。然后在最后一個(gè)卷積層使用滑窗的方式進(jìn)行分類預(yù)測紫岩,將不同窗口的分類結(jié)果平均,再將不同尺寸Q的結(jié)果平均得到最后結(jié)果睬塌,這樣可提高圖片數(shù)據(jù)的利用率并提升預(yù)測準(zhǔn)確率泉蝌。在訓(xùn)練中,VGGNet還使用了Multi-Scale的方法做數(shù)據(jù)增強(qiáng)揩晴,將原始圖像縮放到不同尺寸S勋陪,然后再隨機(jī)裁切224x224的圖片,這樣能增加很多數(shù)據(jù)量硫兰,對(duì)于防止模型過擬合有很不錯(cuò)的效果诅愚。

模型結(jié)構(gòu)

[圖片上傳失敗...(image-7ce165-1548856862938)]


5. ZFNet & AlexNet


Object Detection Models

Two-Stage:

1. R-CNN

2. Faster R-CNN

3. FPN

4. RefineDet

One-Stage:

1. SSD

2. DSSD

3. YOLO

4. RetinaNet

5. RFBNet

Object Segmentation Models

1. FCN

2. U-Net

3. SegNet

4. RefineNet

5. PSPNet

6.Mask-R-CNN

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市劫映,隨后出現(xiàn)的幾起案子呻粹,更是在濱河造成了極大的恐慌,老刑警劉巖苏研,帶你破解...
    沈念sama閱讀 221,406評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件等浊,死亡現(xiàn)場離奇詭異,居然都是意外死亡摹蘑,警方通過查閱死者的電腦和手機(jī)筹燕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,395評(píng)論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人撒踪,你說我怎么就攤上這事过咬。” “怎么了制妄?”我有些...
    開封第一講書人閱讀 167,815評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵掸绞,是天一觀的道長。 經(jīng)常有香客問我耕捞,道長衔掸,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,537評(píng)論 1 296
  • 正文 為了忘掉前任俺抽,我火速辦了婚禮敞映,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘磷斧。我一直安慰自己振愿,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,536評(píng)論 6 397
  • 文/花漫 我一把揭開白布弛饭。 她就那樣靜靜地躺著冕末,像睡著了一般。 火紅的嫁衣襯著肌膚如雪侣颂。 梳的紋絲不亂的頭發(fā)上档桃,一...
    開封第一講書人閱讀 52,184評(píng)論 1 308
  • 那天,我揣著相機(jī)與錄音横蜒,去河邊找鬼胳蛮。 笑死销凑,一個(gè)胖子當(dāng)著我的面吹牛丛晌,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播斗幼,決...
    沈念sama閱讀 40,776評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼澎蛛,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蜕窿?” 一聲冷哼從身側(cè)響起谋逻,我...
    開封第一講書人閱讀 39,668評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎桐经,沒想到半個(gè)月后毁兆,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,212評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡阴挣,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,299評(píng)論 3 340
  • 正文 我和宋清朗相戀三年气堕,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,438評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡茎芭,死狀恐怖揖膜,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情梅桩,我是刑警寧澤壹粟,帶...
    沈念sama閱讀 36,128評(píng)論 5 349
  • 正文 年R本政府宣布,位于F島的核電站宿百,受9級(jí)特大地震影響趁仙,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜犀呼,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,807評(píng)論 3 333
  • 文/蒙蒙 一幸撕、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧外臂,春花似錦坐儿、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,279評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至罪佳,卻和暖如春逛漫,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背赘艳。 一陣腳步聲響...
    開封第一講書人閱讀 33,395評(píng)論 1 272
  • 我被黑心中介騙來泰國打工酌毡, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人蕾管。 一個(gè)月前我還...
    沈念sama閱讀 48,827評(píng)論 3 376
  • 正文 我出身青樓枷踏,卻偏偏與公主長得像,于是被迫代替她去往敵國和親掰曾。 傳聞我的和親對(duì)象是個(gè)殘疾皇子旭蠕,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,446評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容