1啸罢、平均池化mean-pooling。
鄰域點(diǎn)周圍取平均值胎食。能很好的保留背景扰才,但容易使得圖片變模糊。
2厕怜、最大池化max-pooling衩匣。
鄰域點(diǎn)內(nèi)取最大值。能很好的保留紋理特征粥航。
3琅捏、隨機(jī)池化stochastic-pooling。
按特征圖中元素概率值大小隨機(jī)選擇递雀。泛化性強(qiáng)柄延。
4、全局平均池化global-average-pooling缀程。
代替全連接層拦焚,整幅特征圖進(jìn)行平均池化蜡坊。大大減少參數(shù)個(gè)數(shù)和過擬合現(xiàn)象。
5赎败、空間金字塔池化spatial-pyramid-pooling秕衙。
進(jìn)入SPP層 。我們先看最左邊有16個(gè)藍(lán)色小格子的圖僵刮,它的意思是將從conv5得到的特征映射分成16份据忘,另外16X256中的256表示的是channel,即SPP對每一層都分成16份(不一定是等比分搞糕,原因看后面的內(nèi)容就能理解了)勇吊。中間的4個(gè)綠色小格子和右邊1個(gè)紫色大格子也同理,即將特征映射分別分成4X256和1X256份
那么將特征映射分成若干等分是做什么用的呢窍仰? 我們看SPP的名字就是到了汉规,是做池化操作,一般選擇MAX Pooling驹吮,即對每一份進(jìn)行最大池化针史。
我們看上圖,通過SPP層碟狞,特征映射被轉(zhuǎn)化成了16X256+4X256+1X256 = 21X256的矩陣啄枕,在送入全連接時(shí)可以擴(kuò)展成一維矩陣,即1X10752族沃,所以第一個(gè)全連接層的參數(shù)就可以設(shè)置成10752了频祝,這樣也就解決了輸入數(shù)據(jù)大小任意的問題了。
6脆淹、空洞空間卷積池化金字塔Atrous Spatial Pyramid Pooling常空。
設(shè)計(jì)了幾種不同采樣率的空洞卷積來捕捉多尺度信息。