《A semi-supervised convolutional neural network for hyperspectral image classification》
摘要- CNN在有足夠的標(biāo)簽數(shù)據(jù)的前提下能夠表現(xiàn)出強(qiáng)大的學(xué)習(xí)能力,但是對于HSI來說,標(biāo)簽數(shù)據(jù)非常有限。本文的主要工作提出了一種半監(jiān)督的CNN架構(gòu),而且在編碼-解碼中間添加了跳躍連接使得網(wǎng)絡(luò)能夠更好的實(shí)現(xiàn)半監(jiān)督學(xué)習(xí)牍鞠。同時(shí)在訓(xùn)練的時(shí)候?qū)⒈O(jiān)督和半監(jiān)督的損失函數(shù)一同訓(xùn)練。半監(jiān)督學(xué)習(xí)是一種解決標(biāo)簽數(shù)據(jù)不足的一種方法。
1. Introduction
HSI分類問題實(shí)際上就是一種語義分割問題畔濒,為圖像中的每個(gè)像素分配一個(gè)不同的標(biāo)簽。HSI圖像包含了數(shù)百個(gè)光譜帶锣咒,提供了大量的有價(jià)值的光譜-空間信息侵状,但是其復(fù)雜的結(jié)構(gòu)和標(biāo)簽樣本不足使得特征的提取面臨著挑戰(zhàn)。
在早期毅整,像最近鄰趣兄、決策樹、線性函數(shù)等應(yīng)用于HSI分類任務(wù)中悼嫉,但是這些方法對Hughes 現(xiàn)象過于敏感艇潭,之后提出用核方法SVM去解決Hughes現(xiàn)象,并且在相當(dāng)長的時(shí)間內(nèi),這都是一種主流方法暴区。同時(shí)extreme learning machine
闯团、active learning
、sparse representation
也取得一些不錯(cuò)的效果仙粱。
直到深度學(xué)習(xí)的出現(xiàn)房交,SAE在2014年被Chen等人[1]應(yīng)用于HSI分類任務(wù)中取得不錯(cuò)效果。CNN在2015年被Hu等人[2]應(yīng)用于HSI分類任務(wù)中伐割,用來提取光譜特征候味。在之后CNN被用來提取光譜-空間特征取得非常大的進(jìn)步。但是這些深度方法需要大量的參數(shù)需要訓(xùn)練隔心,如果訓(xùn)練數(shù)據(jù)不足白群,很容易引發(fā)過擬合現(xiàn)象。在這種背景下硬霍,針對有限標(biāo)記樣本的問題帜慢,Chen等人[3]提出了一種虛擬樣本增強(qiáng)方法。Li等人[4]提出了一種像素對方法唯卖,顯著增加訓(xùn)練樣本數(shù)量粱玲,保證了CNN的優(yōu)勢。許多半監(jiān)督算法已經(jīng)證明:使用無標(biāo)記數(shù)據(jù)有助于提高分類性能拜轨。然而抽减,目前基于深度學(xué)習(xí)的高光譜圖像分類方法不能很好地利用大量的未標(biāo)記數(shù)據(jù)。
本篇論文的主要目標(biāo)就是:處理復(fù)雜的數(shù)據(jù)結(jié)構(gòu)橄碾;HSI的有限標(biāo)簽樣本卵沉。
本片論文的主要貢獻(xiàn):
- CNN網(wǎng)絡(luò)架構(gòu)直接從原始的高維的HSI數(shù)據(jù)中提取光譜-空間特征
- CNN中引入Ladder network(梯形網(wǎng)絡(luò))使得網(wǎng)絡(luò)更加適合半監(jiān)督學(xué)習(xí)
- 為了解決標(biāo)簽數(shù)據(jù)過少的情況,半監(jiān)督CNN同時(shí)最小化半監(jiān)督和監(jiān)督代價(jià)函數(shù)
2. 半監(jiān)督CNN
2.1 符號(hào)約定
圖1所示的半監(jiān)督CNN由clean encoder
法牲,corrupted encoder
和decoder
組成史汗。為了使模型學(xué)習(xí)去噪,在corrupted encoder
的每一層都加入高斯噪聲皆串。解碼器的目標(biāo)是通過最小化與clean encoder
的差異來估計(jì)corrupted encoder
去噪版本淹办。clean encoder
和corrupted encoder
共享權(quán)重。此外恶复,將分批歸一化(BN)應(yīng)用于包括網(wǎng)絡(luò)最頂層在內(nèi)的每個(gè)激活函數(shù)之前怜森,以加快收斂速度,提高分類精度谤牡。
在圖1中副硅,x表示原始輸入的高光譜信號(hào)。是x的
corrupted version
翅萤。是x的重建信號(hào)恐疲。
是clean層
的變量值腊满。
是corrupted層
的變量值l。
是解碼器層
的變量值培己。
是corrupted 編碼器層的輸出標(biāo)簽碳蛋。
是clean編碼器的輸出標(biāo)簽。
卷積層的卷積函數(shù)省咨。
是池化層的池化函數(shù)肃弟。
是完全連接層的卷積函數(shù)。
是每一層的無監(jiān)督成本零蓉。和
是解碼器層
的去噪函數(shù)笤受。
2.2 編碼器的卷積、池化和全連接層
clean編碼器中的每一層都表示為 (1):
在等式(1)中:
-
是分量批量標(biāo)準(zhǔn)化(BN)
-
是
的組成部分敌蜂。
-
箩兽、
分別是minibatch的平均誤差和標(biāo)準(zhǔn)差。
-
是層
和層
之間的權(quán)重矩陣
-
和
是可訓(xùn)練的參數(shù)
-
是輸出層的softmax激活函數(shù)章喉,
是其他層的ReLU激活函數(shù)汗贫。
我們選擇一個(gè)像素的鄰域作為網(wǎng)絡(luò)的輸入,其中
是高光譜圖像頻帶的個(gè)數(shù)秸脱。
是步幅為1芳绩、大小為
卷積層的卷積核。
是步幅為2撞反、大小為
池化層的窗口大小。
是卷積和池化層的輸出頻帶數(shù)搪花。池化過程是通過與
卷積來實(shí)現(xiàn)的遏片,以減少中間表示的維數(shù)。在池化成層之后撮竿,將特征向量展平與全連接層相連接吮便。
corrupted encoder
編碼器的表達(dá)式與所述clean encoder
編碼器類似。corrupted encoder
編碼器的公式表達(dá):
其中:
-
高斯噪聲
- 其他參數(shù)和
clean encoder
編碼器相同幢踏。我們需要計(jì)算以計(jì)算無監(jiān)督成本髓需。
2.3 階梯網(wǎng)絡(luò)和解碼器
2.4 半監(jiān)督學(xué)習(xí)
高光譜圖像中標(biāo)記樣本非常有限,監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí)的矛盾使得兩者不能很好地融合房蝉。通常情況下僚匆,未標(biāo)記的樣本僅用于傳統(tǒng)深度學(xué)習(xí)方法的預(yù)訓(xùn)練。通過梯形網(wǎng)絡(luò)搭幻,解碼器可以通過編碼器與解碼器之間的跳過連接咧擂,恢復(fù)編碼器丟棄的任何細(xì)節(jié),從而減輕了模型高層中表示細(xì)節(jié)的壓力檀蹋。梯形網(wǎng)絡(luò)使得無監(jiān)督學(xué)習(xí)適合于有監(jiān)督學(xué)習(xí)松申。因此,采用半監(jiān)督學(xué)習(xí)策略對參數(shù)進(jìn)行訓(xùn)練,以充分利用大量未標(biāo)記樣本贸桶。
·····ing
-
Chen, Y., Z. Lin, X. Zhao, G. Wang, and G. Yanfeng. 2014. “Deep Learning-Based Classification of Hyperspectral Data.” IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 7 (6): 2094–2097. doi:10.1109/JSTARS.2014.2329330. ?
-
Hu, W., Y. Huang, L. Wei, F. Zhang, and H. Li. 2015. “Deep Convolutional Neural Networks for Hyperspectral Image Classification.” Journal of Sensors 2015: 1–12. doi:10.1155/2015/258619. ?
-
Chen, Y., H. Jiang, L. Chunyang, X. Jia, and P. Ghamisi. 2016. “Deep Feature Extraction and Classification of Hyperspectral Images Based on Convolutional Neural Networks.” IEEE Transactions on Geoscience and Remote Sensing 54 (10): 6232–6251. doi:10.1109/TGRS.2016.2584107. ?
-
Li, W., W. Guodong, F. Zhang, and D. Qian. 2016. “Hyperspectral Image Classification Using Deep Pixel- Pair Features.” IEEE Transactions on Geoscience and Remote Sensing. doi:10.1109/TGRS.2016.2603190. ?