FCN:
GAN
GAN網(wǎng)絡:
1.Unet-gan
2.FCN+GAN
FPN(Featured Pyramid Networks特征金字塔網(wǎng)絡)
DenseNet+LAU+GAU
Paper:
Road Extraction from High-Resolution Remote Sensing Imagery Using Deep Learning
Architecture:
LAU 旨在融合不同尺度的特征圖欣除,并從 DenseNet 的深層關(guān)注像素級信息住拭。 為了提高 LAU 從不同尺度特征圖中提取信息的性能,本文應用了四種不同的卷積操作历帚,內(nèi)核大小為 1×1滔岳、3×3、5×5挽牢、7×7谱煤。這些特征由 LAU 集成 以逐步的方式從下到上(圖 2),通過這種方式禽拔,可以精確地結(jié)合來自相鄰尺度的上下文信息刘离。 在 LAU 的頂部,1×1 卷積被設計為逐像素乘以從底部卷積操作中提取的特征信息睹栖。 金字塔結(jié)構(gòu)融合不同尺度信息硫惕,而逐像素乘法可以更好地提取局部像素級信息用于道路提取。
GAU
SegNet
Pooling Indices
上采樣野来,顧名思義就是池化的反向處理恼除。但是在上采樣當中存在著一個不確定性,即一個1x1的特征點經(jīng)過上采樣將會變成一個2x2特征區(qū)域曼氛,這個區(qū)域中的某個1x1區(qū)域?qū)辉瓉淼?x1特征點取代豁辉,其他的三個區(qū)域為空。但是哪個1x1區(qū)域會被原特征點取代呢舀患?一個做法就是隨機將這個特征點分配到任意的一個位置徽级,或者干脆給它分配到一個固定的位置。但是這樣做無疑會引入一些誤差聊浅,并且這些誤差會傳遞給下一層餐抢。層數(shù)越深,誤差影響的范圍也就越大狗超。所以把1x1特征點放到正確的位置至關(guān)重要.
在Encoder的池化層處理中弹澎,會記錄每一個池化后的1x1特征點來源于之前的2x2的哪個區(qū)域,在這個信息在論文中被稱為Pooling Indices努咐。Pooling Indices會在Decoder中使用苦蒿。既然SegNet是一個對稱網(wǎng)絡,那么在Decoder中需要對特征圖進行上采樣的時候渗稍,我們就可以利用它對應的池化層的Pooling Indices來確定某個1x1特征點應該放到上采樣后的2x2區(qū)域中的哪個位置佩迟。此過程的如下圖所示团滥。
RSRCNN
在交叉熵損失中引入道路結(jié)構(gòu)的幾何信息,提出了一種新的損失函數(shù)报强,稱為基于道路結(jié)構(gòu)的損失函數(shù)灸姊。