空間金字塔池化

SPP空間金字塔池化的重要思想

空間金字塔池化(Spatial Pyramid Pooling layer) 呵曹,使用這種方式,可以讓網(wǎng)絡(luò)輸入任意的圖片钮科,而且還會生成固定大小的輸出唤衫。這樣,整體的結(jié)構(gòu)和之前R-CNN有所不同跺嗽。

實際上战授,卷積層是不需要輸入固定大小的圖片的,并且還可以生成任意大小的特征圖桨嫁,只是全連接層需要固定大小的輸入植兰。因此,固定長度的約束僅限于全連接層璃吧。

分析如下:

CNN大體包含3部分楣导,卷積、池化畜挨、全連接筒繁。

卷積:卷積操作對圖片輸入的大小會有要求嗎?比如一個5*5的卷積核巴元,輸入的圖片是30*81的大小毡咏,可以得到(26,77)大小的圖片,并不會影響卷積操作逮刨。輸入600*500呕缭,它還是照樣可以進行卷積,也就是卷積對圖片輸入大小沒有要求修己。任意大小的圖片進入恢总,都可以進行卷積。

池化:池化對圖片大小會有要求嗎睬愤?比如我池化大小為(2片仿,2)我輸入一張30*40的,那么經(jīng)過池化后可以得到15*20的圖片尤辱。輸入一張53*22大小的圖片砂豌,經(jīng)過池化后厢岂,我可以得到26*11大小的圖片。因此池化這一步也沒對圖片大小有要求奸鸯。輸入任意大小的圖片咪笑,都可以進行池化可帽。

全連接層:既然池化和卷積都對輸入圖片大小沒有要求娄涩,那么就只有全連接層對圖片結(jié)果有要求了。因為全連接層連接權(quán)值矩陣的大小W映跟,經(jīng)過網(wǎng)絡(luò)訓練后蓄拣,大小就固定了。比如我們從卷積到全連層努隙,輸入和輸出的大小球恤,分別是50、30荸镊,那么權(quán)值矩陣50×30大小的矩陣了咽斧。因此空間金字塔池化,要解決的就是從卷積層到全連接層之間的一個過度躬存。

也就是說张惹,在最后一個卷積層與第一個全連接層(fc)之間需要訓練一個大小固定的二維數(shù)組,這樣可以得到的特征更完整一些岭洲,提高了定位與識別的準確率宛逗。如下圖所求:

SPP的具體實現(xiàn)過程

SPP為的就是解決上述的問題,做到的效果為:不管輸入的圖片是什么尺度盾剩,都能夠正確的傳入網(wǎng)絡(luò)

具體方案如下圖所示:

不管最后一個卷積層得到的特征圖(feature maps)的大小雷激,都可將其轉(zhuǎn)化為了(4*4+2*2+1*1)*256的全連接層,也就是這些特征圖的大小不同告私,但通道是相同的屎暇,那么如何將不同大小的特征圖進行spp 呢?

假設(shè)輸入的大小為a*a*c驻粟,然后呢根悼,這些特征圖分別被分成了[1*1,2*2,4*4]大小的塊,期望的輸出為1*1*c,2*2*c,4*4*c,變形為(1*1+2*2+4*4)*c的二維數(shù)組格嗅,這全部是通過池化操作實現(xiàn)的番挺,不過池化層的size和stride是不同的,具體有如下:

輸入為[a,a]屯掖,輸出為[n,n]玄柏,那么pool_size= n/a ,stride= n/a 贴铜,這樣我們就將其轉(zhuǎn)化為了n*n*c的矩陣粪摘,例如13*13瀑晒、10*10要轉(zhuǎn)化為4*4的大小,那么采用[p_s=4,,s=3],[p_s=3,s=2]的池化操作后便可以得到徘意。

如果原圖輸入是227x227苔悦,對于conv5出來后的輸出,是13x13x256的椎咧,可以理解成有256個這樣的filter玖详,每個filter對應一張13x13的激活圖。

如果像上圖那樣將激活圖池化成4x4 2x2 1x1三張子圖勤讽,做max pooling后蟋座,出來的特征就是固定長度的(16+4+1)x256那么多的維度了.如果原圖的輸入不是227x227,出來的特征依然是(16+4+1)x256脚牍;直覺地說向臀,可以理解成將原來固定大小為(3x3)窗口的pool5改成了自適應窗口大小,窗口的大小和激活成比例诸狭,保證了經(jīng)過pooling后出來的feature的長度是一致的.

如果要金字塔的某一層輸出n x n個特征券膀,只需要用窗口大小為:(w/n,h/n)進行池化即可。

當我們有很多層網(wǎng)絡(luò)的時候驯遇,網(wǎng)絡(luò)輸入的是一張任意大小的圖片芹彬,這個時候我們可以一直進行卷積、池化妹懒,直到即將與全連接層連接的時候雀监,就要使用金字塔池化,使得任意大小的特征圖都能夠轉(zhuǎn)換成固定大小的特征向量眨唬,這就是空間金字塔池化的奧妙之處会前!

轉(zhuǎn)載?https://baijiahao.baidu.com/s?id=1615888235953033111&wfr=spider&for=pc

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市匾竿,隨后出現(xiàn)的幾起案子瓦宜,更是在濱河造成了極大的恐慌,老刑警劉巖岭妖,帶你破解...
    沈念sama閱讀 216,470評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件临庇,死亡現(xiàn)場離奇詭異,居然都是意外死亡昵慌,警方通過查閱死者的電腦和手機假夺,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,393評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來斋攀,“玉大人已卷,你說我怎么就攤上這事〈景” “怎么了侧蘸?”我有些...
    開封第一講書人閱讀 162,577評論 0 353
  • 文/不壞的土叔 我叫張陵裁眯,是天一觀的道長。 經(jīng)常有香客問我讳癌,道長穿稳,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,176評論 1 292
  • 正文 為了忘掉前任晌坤,我火速辦了婚禮逢艘,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘泡仗。我一直安慰自己埋虹,他們只是感情好,可當我...
    茶點故事閱讀 67,189評論 6 388
  • 文/花漫 我一把揭開白布娩怎。 她就那樣靜靜地躺著,像睡著了一般胰柑。 火紅的嫁衣襯著肌膚如雪截亦。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,155評論 1 299
  • 那天柬讨,我揣著相機與錄音崩瓤,去河邊找鬼。 笑死踩官,一個胖子當著我的面吹牛却桶,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蔗牡,決...
    沈念sama閱讀 40,041評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼颖系,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了辩越?” 一聲冷哼從身側(cè)響起嘁扼,我...
    開封第一講書人閱讀 38,903評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎黔攒,沒想到半個月后趁啸,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,319評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡督惰,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,539評論 2 332
  • 正文 我和宋清朗相戀三年不傅,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赏胚。...
    茶點故事閱讀 39,703評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡访娶,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出栅哀,到底是詐尸還是另有隱情震肮,我是刑警寧澤称龙,帶...
    沈念sama閱讀 35,417評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站戳晌,受9級特大地震影響鲫尊,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜沦偎,卻給世界環(huán)境...
    茶點故事閱讀 41,013評論 3 325
  • 文/蒙蒙 一疫向、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧豪嚎,春花似錦搔驼、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,664評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至扔字,卻和暖如春囊嘉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背革为。 一陣腳步聲響...
    開封第一講書人閱讀 32,818評論 1 269
  • 我被黑心中介騙來泰國打工扭粱, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人震檩。 一個月前我還...
    沈念sama閱讀 47,711評論 2 368
  • 正文 我出身青樓琢蛤,卻偏偏與公主長得像,于是被迫代替她去往敵國和親抛虏。 傳聞我的和親對象是個殘疾皇子博其,可洞房花燭夜當晚...
    茶點故事閱讀 44,601評論 2 353

推薦閱讀更多精彩內(nèi)容