Deep Few-Shot Learning for Hyperspectral Image Classification

摘要--針對HSI分類任務(wù)樣本不足的問題,提出了一種deep few-shot小樣本學(xué)習(xí)方法饱亮。該算法有三種新的策略:

  1. 利用深度殘差三維卷積神經(jīng)網(wǎng)絡(luò)提取光譜-空間特征贺喝,降低標(biāo)記的不確定性跑杭。
  2. 網(wǎng)絡(luò)通過情景訓(xùn)練來學(xué)習(xí)一個度量空間嚷那,其中來自同一個類的樣本比較接近,而來自不同類的樣本比較遠压真。
  3. 利用在度量空間中學(xué)習(xí)到的最近鄰分類器對測試樣本進行分類娩嚼。

該想法的關(guān)鍵是:設(shè)計了網(wǎng)絡(luò)在訓(xùn)練集上學(xué)習(xí)了度量空間。此外滴肿,這種度量空間可以推廣到測試集的類中岳悟。實驗結(jié)果表明,該方法與傳統(tǒng)的半監(jiān)督方法相比,在只有少量標(biāo)記樣本的情況下贵少,可以獲得更好的分類精度呵俏。

01. Introduction

在HSIs中,收集有標(biāo)記的樣品通常是費時費力的滔灶。相比之下普碎,未標(biāo)記的樣本更容易獲得。這一事實促進了半監(jiān)督學(xué)習(xí)的概念宽气,它可以聯(lián)合利用標(biāo)記和未標(biāo)記的樣本來處理維數(shù)災(zāi)難的問題随常。

本文受few-shot learning的啟發(fā)潜沦,具體來說萄涯,CNN模型被用來訓(xùn)練學(xué)習(xí)一個度量空間。換句話說唆鸡,在數(shù)量充足涝影、與目標(biāo)數(shù)據(jù)集(我的理解是測試集)不同的具有標(biāo)簽的數(shù)據(jù)集上,訓(xùn)練一個CNN模型來提取泛化的特征争占。一旦訓(xùn)練完成燃逻,模型可以從較小的標(biāo)記目標(biāo)數(shù)據(jù)集(測試集)中提取特征。

本文提出一種 deep few-shot learning(DFSL)來對標(biāo)注較少的HSI數(shù)據(jù)進行分類(每個類只有五個標(biāo)記樣本)臂痕,該方法可以分為三個部分:

  1. 從訓(xùn)練集中訓(xùn)練學(xué)習(xí)一個度量空間(metric space)伯襟,然后采用歐氏距離在度量空間中去分離不同的類。
    由于深度CNN模型具有很強的非線性表達能力握童,可以以端到端的方式進行訓(xùn)練姆怪,所以用深度三維CNN (D - 3D CNN)對度量空間進行參數(shù)化。優(yōu)化損失函數(shù)的目的是使網(wǎng)絡(luò)學(xué)習(xí)一個度量空間澡绩,在這個度量空間中的樣本特征具有較小的類內(nèi)間距和較大的類間間距稽揭。為了更好地訓(xùn)練D - 3D CNN,還引入了殘差學(xué)習(xí)肥卡。因此溪掀,最后用深度殘差三維CNN (d - res - 3d CNN)對度量空間進行參數(shù)化。一旦學(xué)習(xí)了網(wǎng)絡(luò)步鉴,就可以把它看作是一個嵌入函數(shù)揪胃。
  2. 利用預(yù)先訓(xùn)練好的D - 3D CNN提取測試數(shù)據(jù)集中所有樣本的特征
  3. 使用簡單的最近鄰算法(nearest neighbor)對測試樣本進行分類

本文的主要貢獻如下:

  1. 提出了一種DFSL方法,通過訓(xùn)練網(wǎng)絡(luò)學(xué)習(xí)一個度量空間氛琢,使同一類的樣本彼此接近喊递。重要的是,這種度量空間將對訓(xùn)練中沒有出現(xiàn)的類執(zhí)行相同的操作艺沼。因此册舞,利用神經(jīng)網(wǎng)絡(luò)分類器可以完成對測試數(shù)據(jù)集的分類。
  2. 使用深度三維CNN對度量空間進行參數(shù)化障般。此外调鲸,為了更好地訓(xùn)練網(wǎng)絡(luò)盛杰,引入了殘差學(xué)習(xí)。這種深度殘差的三維CNN不需要任何預(yù)處理就可以直接從數(shù)據(jù)集中提取光譜空間特征藐石。
  3. 在4個著名的HSI數(shù)據(jù)集上進行了實驗即供,實驗結(jié)果表明,該方法可以在只有少量標(biāo)記樣本的情況下優(yōu)于傳統(tǒng)的半監(jiān)督方法于微。

02. 方法理論介紹

一般來說逗嫡,由于參數(shù)空間和少量的標(biāo)記樣本之間的不平衡,僅僅使用少量的樣本來訓(xùn)練一個深度神經(jīng)網(wǎng)絡(luò)是很有挑戰(zhàn)的一項任務(wù)株依。使用標(biāo)準(zhǔn)的優(yōu)化技術(shù)很大可能會導(dǎo)致過擬合現(xiàn)象的發(fā)生驱证。從人的角度考慮一個問題:人可以從很少的樣本中學(xué)習(xí)到知識來解決現(xiàn)實中遇到的問題。從中受到啟發(fā)恋腕,我們可以先為網(wǎng)絡(luò)制造一些先驗知識抹锄,也就是本文講的度量空間

2.1 深度少樣本學(xué)習(xí)與訓(xùn)練策略

為了學(xué)習(xí)到的度量空間適合于少樣本分類任務(wù)荠藤,本論文使用被稱為eposodes的小樣本取樣來模擬少樣本學(xué)習(xí)任務(wù)伙单。度量空間可以看作是一個用深度神經(jīng)網(wǎng)絡(luò)參數(shù)化的嵌入函數(shù)。換句話說哈肖,使用深度神經(jīng)網(wǎng)絡(luò)通過一個具有可學(xué)習(xí)參數(shù)\phi嵌入函數(shù)f_{\phi} \mathbb{R}^{D} \rightarrow \mathbb{R}^{M} 來計算每個類的表示吻育,其中D表示網(wǎng)絡(luò)輸入的維數(shù),M表示網(wǎng)絡(luò)輸出的維數(shù)淤井。

隨機選擇來自訓(xùn)練集中每一類的子集當(dāng)作episode來計算梯度和更新網(wǎng)絡(luò)布疼。如圖所示,選擇每個類內(nèi)的子集當(dāng)作support set庄吼,將選剩下的樣本當(dāng)作query set缎除。在本文中,每個類選擇一個樣本當(dāng)作support set來模擬在測試集中小樣本分類的情況总寻。support set和query set當(dāng)作網(wǎng)絡(luò)的輸入來提取嵌入特征(embedding feature)器罐。query set中的樣本x屬于哪一類是softmax函數(shù)根據(jù)x在嵌入空間(度量空間)對于support set中樣本的距離來計算的:
p_{\phi}(y=k | \mathbf{x})=\frac{\exp \left(-d\left(f_{\phi}(\mathbf{x}), \mathbf{c}_{k}\right)\right)}{\sum_{k=1}^{N_{C}} \exp \left(-d\left(f_{\phi}(\mathbf{x}), \mathbf{c}_{k}\right)\right)}

其中c_k表示support set中第k類的嵌入特征,\mathbf{X}表示query set中樣本的嵌入特征渐行,y是\mathbf{X}的標(biāo)簽轰坊,d(\cdot)是歐幾里德距離函數(shù)。損失函數(shù)定義為真實類k的負(fù)對數(shù)概率祟印,使用隨機梯度下降(SGD)的方法
\begin{aligned} J(\phi)=-\log p_{\phi}(y=k | \mathbf{x}) &=d\left(f_{\phi}(\mathbf{x}), \mathbf{c}_{k}\right) +\log \sum_{k=1}^{N_{C}} \exp \left(-d\left(f_{\phi}(\mathbf{x}), \mathbf{c}_{k}\right)\right) \end{aligned}

2.2 Deep 3-D CNN

2.2.1 3-D 卷積

http://www.reibang.com/p/1247ff367586

2.2.2Residual Learning(殘差學(xué)習(xí))

參考
https://www.imooc.com/article/44047
https://www.cnblogs.com/alanma/p/6877166.html
http://www.reibang.com/p/09643588f373

研究直接表明訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)失敗的原因并不是梯度消失肴沫,而是權(quán)重矩陣的退化,當(dāng)網(wǎng)絡(luò)層數(shù)達到一定的數(shù)目以后蕴忆,網(wǎng)絡(luò)的性能就會飽和颤芬,再增加網(wǎng)絡(luò)的性能就會開始退化,但是這種退化并不是由過擬合引起的,因為我們發(fā)現(xiàn)訓(xùn)練精度和測試精度都在下降站蝠,這說明當(dāng)網(wǎng)絡(luò)變得很深以后汰具,深度網(wǎng)絡(luò)就變得難以訓(xùn)練了。

ResNet的出現(xiàn)其實就是為了解決網(wǎng)絡(luò)深度變深以后的性能退化問題菱魔。

深度殘差網(wǎng)絡(luò)留荔。如果深層網(wǎng)絡(luò)的后面那些層是恒等映射,那么模型就退化為一個淺層網(wǎng)絡(luò)澜倦。那現(xiàn)在要解決的就是學(xué)習(xí)恒等映射函數(shù)了聚蝶。 但是直接讓一些層去擬合一個潛在的恒等映射函數(shù)H(x) = x,比較困難藻治,這可能就是深層網(wǎng)絡(luò)難以訓(xùn)練的原因碘勉。但是,如果把網(wǎng)絡(luò)設(shè)計為H(x) = F(x) + x栋艳,如上圖恰聘,我們可以轉(zhuǎn)換為學(xué)習(xí)一個殘差函數(shù)F(x) = H(x) - x. 只要F(x)=0句各,就構(gòu)成了一個恒等映射H(x) = x吸占。
(不是很理解這段話)

而且shortcut連接相當(dāng)于簡單執(zhí)行了同等映射,不會產(chǎn)生額外的參數(shù)凿宾,也不會增加計算復(fù)雜度矾屯。 而且,整個網(wǎng)絡(luò)可以依舊通過端到端的反向傳播訓(xùn)練初厚。訓(xùn)練過程中的潛在誤差可以通過快捷方式傳遞到上層件蚕,從而緩解了層數(shù)過多導(dǎo)致梯度消失/爆炸的問題,簡化了深度網(wǎng)絡(luò)的訓(xùn)練

2.2.3 網(wǎng)絡(luò)架構(gòu)

網(wǎng)絡(luò)架構(gòu)圖

如上圖所示产禾,設(shè)計了一個深度三維CNN作為嵌入函數(shù)排作,其中包含兩個殘差塊,兩個池化層亚情,一個卷積層作妄痪。Conv表示具有3×3×3內(nèi)核的三維卷積層。池化表示步長為2×2×4的3D最大-池化函數(shù)楞件,采用ReLU作為激活函數(shù)衫生。

在上圖中,虛線框是一個殘差塊土浸。池化層將導(dǎo)致shotcut和主路徑的維度不同罪针。因此,在殘差塊中不使用池化層黄伊。而且泪酱,每個殘差塊都與一個3D最大-池化層連接,以減少計算、聚合特性墓阀。由于輸入立方體的高光譜維數(shù)愈腾,將其沿光譜維數(shù)的步長設(shè)為4,沿空間維數(shù)的步長設(shè)為2岂津。最后虱黄,將特征映射平鋪成一維向量。設(shè)計的深三維CNN采用算法1所示的策略進行訓(xùn)練吮成。以這種方式橱乱,所設(shè)計的網(wǎng)絡(luò)可以學(xué)習(xí)度量空間,其中具有相同類的樣本彼此接近粱甫。

2.3 使用最近鄰算法進行分類

測試數(shù)據(jù)集的分類主要包括三個步驟:

  1. 通過預(yù)訓(xùn)練的深度殘差3-D CNN提取嵌入特征;
  2. 計算標(biāo)記樣本與待分類樣本之間的歐式距離;
  3. 通過最近鄰NN分類器確定最終標(biāo)簽泳叠。

實際上,所設(shè)計的深度殘差三維CNN可以看作是經(jīng)過訓(xùn)練后的一種嵌入函數(shù)茶宵。在測試數(shù)據(jù)集的分類過程中危纫,所有樣本都通過預(yù)先訓(xùn)練好的深度殘差3d CNN進行輸入,提取特征乌庶。然后隨機選取幾個有標(biāo)記的樣本作為監(jiān)督樣本种蝶。經(jīng)過訓(xùn)練的網(wǎng)絡(luò)使得相似的樣本在嵌入空間中彼此接近。因此瞒大,通過簡單的神經(jīng)網(wǎng)絡(luò)分析螃征,可以對測試樣本進行分類,如圖6所示透敌。需要注意的是盯滚,培訓(xùn)數(shù)據(jù)集和測試數(shù)據(jù)集是相互獨立的。最后酗电,將測試樣本標(biāo)簽生成的分類圖與groundtruth圖進行匹配魄藕,對不同的分類方法進行評估。

03. 實驗分析

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末撵术,一起剝皮案震驚了整個濱河市背率,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌荷荤,老刑警劉巖退渗,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異蕴纳,居然都是意外死亡会油,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進店門古毛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來翻翩,“玉大人都许,你說我怎么就攤上這事∩┒常” “怎么了胶征?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長桨仿。 經(jīng)常有香客問我睛低,道長,這世上最難降的妖魔是什么服傍? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任钱雷,我火速辦了婚禮,結(jié)果婚禮上吹零,老公的妹妹穿的比我還像新娘罩抗。我一直安慰自己,他們只是感情好灿椅,可當(dāng)我...
    茶點故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布套蒂。 她就那樣靜靜地躺著,像睡著了一般茫蛹。 火紅的嫁衣襯著肌膚如雪操刀。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天麻惶,我揣著相機與錄音馍刮,去河邊找鬼。 笑死窃蹋,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的静稻。 我是一名探鬼主播警没,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼振湾!你這毒婦竟也來了杀迹?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤押搪,失蹤者是張志新(化名)和其女友劉穎树酪,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體大州,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡续语,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了厦画。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片疮茄。...
    茶點故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡滥朱,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出力试,到底是詐尸還是另有隱情徙邻,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布畸裳,位于F島的核電站缰犁,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏怖糊。R本人自食惡果不足惜民鼓,卻給世界環(huán)境...
    茶點故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蓬抄。 院中可真熱鬧丰嘉,春花似錦、人聲如沸嚷缭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽阅爽。三九已至路幸,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間付翁,已是汗流浹背简肴。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留百侧,地道東北人砰识。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像佣渴,于是被迫代替她去往敵國和親辫狼。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,927評論 2 355