深度學(xué)習(xí)之:deep Feature Extractor[VGG]

0. 背景

Karen Simonyan等人在2014年參加Imagenet挑戰(zhàn)賽的時候提出的深度卷積神經(jīng)網(wǎng)絡(luò)垃杖。作者通過對2013年的ILSVRC中最好的深度神經(jīng)網(wǎng)絡(luò)模型(他們最初的對應(yīng)模型都是alexnet)進(jìn)行研究,發(fā)現(xiàn)他們使用了更小的感受野凶硅,并且在第一層卷積層中使用了更小的stride尝苇,也就是這兩點(diǎn)都有助于準(zhǔn)確度的提升雳旅。所以本文就不去做無用功跌造,從網(wǎng)絡(luò)的深度去挖掘CNN模型的提升空間杆怕,并且發(fā)現(xiàn)當(dāng)網(wǎng)絡(luò)深度在超過16層時,有明顯的提升效果壳贪,故而如果截取當(dāng)前16層的網(wǎng)絡(luò)陵珍,就被稱之為VGG16。
從感受野角度來說违施,兩個3?3的卷積核疊加互纯,就等于一個5?5的卷積核的結(jié)果】钠眩可是從參數(shù)量上留潦,前者明顯會小于后者。而且從分層角度上看亿卤,因為之間會通過非線性激活函數(shù)的轉(zhuǎn)換愤兵,所以3?3的卷積核疊加還能得到更非線性的特征提取結(jié)果為了遵循單一變量的原則,除了深度外排吴,其他涉及到的參數(shù)基本保持一致。

1. 模型

圖1.1 VGG不同深度時的網(wǎng)絡(luò)結(jié)構(gòu)

如圖1.1所示懦鼠,圖片的輸入都是

如圖1.1所示钻哩,圖片的輸入都是224?224,卷積核大小都是3?3肛冶,滑動的步長stride=1街氢,在某些卷積層后面跟上最大池化,其中池化的大小為2?2睦袖,且每一層卷積都是保留尺寸的卷積(即卷積之后珊肃,feature map的大小不變),且為了降維、對通道的線性變換伦乔、增加決策函數(shù)的非線性等目的厉亏,采用了《network in network》中的1?1的卷積操作。其中FC層表示該層為全連接層烈和。
作者通過試驗發(fā)現(xiàn)alexnet中的LRN(Local Response Normalisation爱只,LRN)不但不利于準(zhǔn)確度提升,反而還會占用內(nèi)存招刹,所以都省略了該層恬试。

圖1.2 不同深度VGG下參數(shù)量,單位為百萬

2. 訓(xùn)練結(jié)果

作者在訓(xùn)練的時候疯暑,開始先訓(xùn)練模型A训柴,然后在訓(xùn)練模型B的時候,將前面幾層CNN和最后的全連接層的參數(shù)用模型A的權(quán)重來初始化妇拯,以此達(dá)到用小模型去預(yù)訓(xùn)練大模型的目的畦粮;
而且,作者用S表示對訓(xùn)練集圖片做的一個縮放乖阵,用Q表示對測試集圖片做的一個縮放宣赔,當(dāng)然其中S和Q都不得小于224。

簡單的訓(xùn)練過程如下:

  • 給定S和Q值瞪浸,將圖片進(jìn)行各方向同性縮放到S和Q儒将;
  • 然后用crop的方法對縮放后的圖片進(jìn)行采樣到224?224;
  • 將crop采樣得到的圖片放入VGG模型中訓(xùn)練对蒲。


    圖2.1基于單尺度測試情況下的結(jié)果
圖2.2基于多尺度測試情況下的結(jié)果

從圖2.1和圖2.2中可以看出:從C模型與D模型對比钩蚊,可以肯定深度的好處的確有助于準(zhǔn)確度的提升;而從E模型與D模型的對比蹈矮,發(fā)現(xiàn)還是E模型更好砰逻,作者認(rèn)為深度有助于提升準(zhǔn)確度,可是模型還是需要通過卷積核去抓取空間上下文信息泛鸟。

因為大家通常都是直接將基于imagenet訓(xùn)練好的VGG拿來用蝠咆,所以基本沒多少人會從0開始訓(xùn)練VGG網(wǎng)絡(luò)。而且論文中也顯示4塊卡北滥,也需要小心的訓(xùn)練2-3個禮拜刚操。本文只著重于VGG的網(wǎng)絡(luò)結(jié)構(gòu),如有必要再芋,后續(xù)再補(bǔ)全該博文菊霜。

參考文獻(xiàn):
[] - Zeiler M D, Fergus R. Visualizing and understanding convolutional networks[C]//European conference on computer vision. Springer, Cham, 2014: 818-833.
[] - Sermanet, P., Eigen, D., Zhang, X., Mathieu, M., Fergus, R., and LeCun, Y. OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks. In Proc. ICLR, 2014[]

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市济赎,隨后出現(xiàn)的幾起案子鉴逞,更是在濱河造成了極大的恐慌记某,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡瓷马,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進(jìn)店門贺拣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人捂蕴,你說我怎么就攤上這事譬涡。” “怎么了啥辨?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵涡匀,是天一觀的道長。 經(jīng)常有香客問我溉知,道長陨瘩,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任级乍,我火速辦了婚禮舌劳,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘玫荣。我一直安慰自己甚淡,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布捅厂。 她就那樣靜靜地躺著贯卦,像睡著了一般。 火紅的嫁衣襯著肌膚如雪焙贷。 梳的紋絲不亂的頭發(fā)上撵割,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天,我揣著相機(jī)與錄音辙芍,去河邊找鬼啡彬。 笑死,一個胖子當(dāng)著我的面吹牛沸手,可吹牛的內(nèi)容都是我干的外遇。 我是一名探鬼主播,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼契吉,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了诡渴?” 一聲冷哼從身側(cè)響起捐晶,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤菲语,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后惑灵,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體山上,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年英支,在試婚紗的時候發(fā)現(xiàn)自己被綠了佩憾。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡干花,死狀恐怖妄帘,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情池凄,我是刑警寧澤抡驼,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站肿仑,受9級特大地震影響致盟,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜尤慰,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一馏锡、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧伟端,春花似錦杯道、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至玛歌,卻和暖如春昧港,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背支子。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工创肥, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人值朋。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓叹侄,卻偏偏與公主長得像,于是被迫代替她去往敵國和親昨登。 傳聞我的和親對象是個殘疾皇子趾代,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內(nèi)容