如何在MSTAR SAR圖像目標(biāo)識(shí)別數(shù)據(jù)集中刷出99.5%的準(zhǔn)確率庸队？

1积蜻、背景介紹

與自然圖像識(shí)別研究的快速發(fā)展不同，在遙感SAR圖像識(shí)別領(lǐng)域彻消，因?yàn)槟繕?biāo)探測(cè)手段的困難竿拆，難以獲取足量公開的數(shù)據(jù)集，其中美國(guó)公開的MSTAR是為數(shù)不多的宾尚、對(duì)地車輛目標(biāo)進(jìn)行識(shí)別的數(shù)據(jù)集丙笋。MSTAR是在二十世紀(jì)九十年代中期，美國(guó)國(guó)防高等研究計(jì)劃署（DARPA）推出煌贴。通過高分辨率的聚束式合成孔徑雷達(dá)采集多種前蘇聯(lián)目標(biāo)軍事車輛的SAR圖像御板。MSTAR計(jì)劃進(jìn)行了SAR實(shí)測(cè)地面目標(biāo)試驗(yàn)，包括目標(biāo)遮擋牛郑、偽裝怠肋、配置變化等擴(kuò)展性條件，形成了較為系統(tǒng)淹朋、全面的實(shí)測(cè)數(shù)據(jù)庫(kù)笙各。隨后，DARPA公布了該數(shù)據(jù)庫(kù)础芍。目前MSTAR數(shù)據(jù)集在SAR圖像目標(biāo)識(shí)別研究上得到廣泛應(yīng)用杈抢。官方數(shù)據(jù)文件下載鏈接為，需要先注冊(cè)再下載（注冊(cè)很簡(jiǎn)單）：https://www.sdms.afrl.af.mil/index.php?collection=registration

????? 采集該數(shù)據(jù)集的傳感器為高分辨率的聚束式合成孔徑雷達(dá)仑性，該雷達(dá)的分辨率為0.3m×0.3m惶楼。工作在X波段，所用的極化方式為HH極化方式诊杆。對(duì)采集到的數(shù)據(jù)進(jìn)行前期處理歼捐，從中提取出像素大小為128×128包含各類目標(biāo)的切片圖像。該數(shù)據(jù)大多是靜止車輛的SAR切片圖像晨汹，包含多種車輛目標(biāo)在各個(gè)方位角下獲取到的目標(biāo)圖像豹储。在該數(shù)據(jù)集中包含一個(gè)該計(jì)劃推薦使用的訓(xùn)練集和測(cè)試集。訓(xùn)練集是雷達(dá)工作俯仰角為17時(shí)所得到的目標(biāo)圖像數(shù)據(jù)宰缤，包括3大類:BTR70（裝甲運(yùn)輸車），BMP2（步兵戰(zhàn)車）晃洒，T72（坦克）慨灭；測(cè)試集是雷達(dá)工作俯仰角為時(shí)所得到的目標(biāo)圖像數(shù)據(jù)，該數(shù)據(jù)集也包含3大類球及，BMP2氧骤、T72、BTR70吃引。各種類別的目標(biāo)還具有不同的型號(hào)筹陵，同類但不同型號(hào)的目標(biāo)在配備上有些差異刽锤，但總體散射特性相差不大。

????? MSTAR混合目標(biāo)數(shù)據(jù)中還包含其他的一組軍事目標(biāo)的切片圖像朦佩，這些軍事目標(biāo)分別為2S1（自行榴彈炮）并思、BRDM2（裝甲偵察車）、BTR60（裝甲運(yùn)輸車）语稠、D7（推土機(jī)）宋彼、T62（坦克）、ZIL131（貨運(yùn)卡車）仙畦、ZSU234（自行高炮）输涕、T72。

圖1 典型車輛目標(biāo)光學(xué)與SAR圖像展示??

2慨畸、數(shù)據(jù)集前期處理

MSTAR數(shù)據(jù)集中的目標(biāo)是雷達(dá)工作在多種不同的俯仰角時(shí)莱坎，各個(gè)目標(biāo)在方向上面的成像圖片。MSTAR數(shù)據(jù)集的采集條件分為兩類寸士，分別為標(biāo)準(zhǔn)工作條件（Standard Operating Condition檐什，SOC）和擴(kuò)展工作條件（Extended Operating Condition，EOC）碉京。這些SAR圖像是基于多種采集條件生成的厢汹，如改變成像側(cè)視角、目標(biāo)姿態(tài)或目標(biāo)序列號(hào)等谐宙。因此烫葬，MSTAR數(shù)據(jù)集可以測(cè)試SAR目標(biāo)識(shí)別算法在不同采集條件下的識(shí)別性能。

SOC采集條件下共包括10類地面目標(biāo)凡蜻。訓(xùn)練集數(shù)據(jù)采集在17搭综。成像側(cè)視角下，測(cè)試集數(shù)據(jù)采集在15划栓。側(cè)視角下兑巾。SOC采集條件下樣本數(shù)據(jù)的詳細(xì)信息（目標(biāo)類型、樣本數(shù)量忠荞、目標(biāo)序列號(hào)以及采集側(cè)視角等）如表2.10所示蒋歌。

與SOC采集條件相比，EOC采集條件下樣本識(shí)別難度更高委煤。EOC條件下包括EOC-1和EOC-2兩種實(shí)驗(yàn)方案堂油。EOC-1和EOC-2條件下訓(xùn)練集和測(cè)試集樣本的詳細(xì)信息分別列于表2.11、表2.12和表2.13碧绞。

EOC-1實(shí)驗(yàn)方案中包含4類地面目標(biāo)府框，訓(xùn)練集的側(cè)視角為17。讥邻，而測(cè)試集的側(cè)視角為30迫靖。院峡，如此大的側(cè)視角差別可導(dǎo)致相同姿態(tài)的同一個(gè)目標(biāo)呈現(xiàn)有較明顯的區(qū)別表征，增加了識(shí)別的難度系宜。EOC-2實(shí)驗(yàn)方案中訓(xùn)練集包含4類地面目標(biāo)照激，采集在17。側(cè)視角條件下蜈首，測(cè)試集分別使用不同序列號(hào)版本的T72目標(biāo)实抡，而不同序列號(hào)版本的目標(biāo)會(huì)呈現(xiàn)有一定區(qū)別的目標(biāo)表征。訓(xùn)練集與測(cè)試集樣本中目標(biāo)表征的區(qū)別使得測(cè)試集的樣本不易被識(shí)別為T72目標(biāo)欢策，因此增加了識(shí)別的難度吆寨。

具體組成如下所示：

表1?MSTAR數(shù)據(jù)集SOC條件下數(shù)據(jù)類型

表2 MSTAR數(shù)據(jù)集中EOC-1采集條件下的4類目標(biāo)

表3 MSTAR數(shù)據(jù)集中EOC-2采集條件下的訓(xùn)練集

表4?MSTAR數(shù)據(jù)集中EOC-2采集條件下的測(cè)試集

我們的目標(biāo)，就是對(duì)SOC工作模式下獲取的數(shù)據(jù)進(jìn)行識(shí)別處理踩寇。

2.1數(shù)據(jù)格式轉(zhuǎn)換

下載數(shù)據(jù)后啄清，我們可以看到得到有8個(gè)文件夾，其中MSTAR-PublicClutter-CD1俺孙、MSTAR-PublicClutter-CD2辣卒、MSTAR-PublicMixedTargets-CD1、MSTAR-PublicMixedTargets-CD2睛榄、MSTAR-PublicT72Variants-CD1荣茫、MSTAR-PublicT72Variants-CD2、MSTAR-PublicTargetChips-T72-BMP2-BTR70-SLICY表示不同條件下獲取的數(shù)據(jù)场靴，但原始數(shù)據(jù)均為只讀文本啡莉，需要轉(zhuǎn)換成圖片格式。從網(wǎng)上下載了matlab解析程序旨剥，可以直接轉(zhuǎn)化為圖片形式咧欣，如圖1所示。

2.2圖片裁剪

轉(zhuǎn)換后的數(shù)據(jù)轨帜，大小不一魄咕，部分大小如下表所示 ???????

同時(shí)可以發(fā)現(xiàn)，目標(biāo)已經(jīng)處于圖片正中位置蚌父，而且只占據(jù)全圖不大的區(qū)域哮兰，為了識(shí)別方便，需要對(duì)10類數(shù)據(jù)進(jìn)行裁剪苟弛。不影響目標(biāo)條件下喝滞，我們都裁剪為100*100。裁剪后部分圖片見圖1嗡午。為了直觀起見囤躁，我們將每類目標(biāo)以圖片形式存在在磁盤內(nèi)冀痕，每類目標(biāo)文件夾命名為目標(biāo)名荔睹。

3. 網(wǎng)絡(luò)搭建與建模

下面重點(diǎn)來了狸演，如何針對(duì)這個(gè)SOC工作條件下的數(shù)據(jù)集刷出99.5%以上的識(shí)別準(zhǔn)確率呢？我們直接給出方案僻他，就是數(shù)據(jù)增廣預(yù)處理+pretraining + Fine-tune 宵距。

為何使用數(shù)據(jù)增廣預(yù)處理？因?yàn)閿?shù)據(jù)量不夠吨拗，每類目標(biāo)只有約200多個(gè)訓(xùn)練數(shù)據(jù)满哪，而且因?yàn)槌上竦脑颍直媛使潭ㄈ芭瘛⑿D(zhuǎn)角度均勻哨鸭、氣象條件一致。因此需要做基于圖像預(yù)處理的增廣方法娇妓。

為何采用pre-training + Fine-tune像鸡？盡管已有研究指出（參考Kaiming He大神的《Rethinking ImageNet Pre-training》），預(yù)訓(xùn)練并非必要哈恰，但前提是對(duì)于類似ImageNet這類數(shù)據(jù)量極大的情況只估，在實(shí)際應(yīng)用中，如果數(shù)據(jù)量小着绷，采用預(yù)訓(xùn)練+Fine-tune不僅可以加速目標(biāo)任務(wù)的收斂速度蛔钙，而且可以在一定程度上減小過擬合。

3.1 關(guān)于數(shù)據(jù)預(yù)處理

在圖像處理領(lǐng)域荠医，常常通過對(duì)圖像做亮度改變吁脱、加噪聲、翻轉(zhuǎn)子漩、隨機(jī)裁切豫喧、縮放等預(yù)處理操作制造出大量樣本。具體包括：（1）平移幢泼，對(duì)原始小樣本進(jìn)行圖像的平移操作時(shí)紧显，可以使得網(wǎng)絡(luò)學(xué)習(xí)到的平移不變特征；（2）旋轉(zhuǎn)缕棵，圖像旋轉(zhuǎn)技術(shù)孵班，可以在進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)時(shí)學(xué)習(xí)到旋轉(zhuǎn)不變的特征，有些任務(wù)里招驴，目標(biāo)可能有很多種不同的姿態(tài)篙程，旋轉(zhuǎn)整好可以補(bǔ)充樣本中姿態(tài)較少的問題；（3）圖像鏡像技術(shù)别厘，鏡像技術(shù)與圖像旋轉(zhuǎn)的功能類似虱饿，都是可以圖像的不同姿態(tài)表達(dá)的問題；（4）圖像亮度變化，一般常用圖像直方圖均衡化進(jìn)行變化氮发，可以較好的進(jìn)行不同亮度下的圖像樣本增強(qiáng)渴肉；（5）裁剪，將圖像中的部分目標(biāo)裁剪出來爽冕，有助于學(xué)習(xí)目標(biāo)的部分結(jié)構(gòu)特征仇祭；（6）縮放，對(duì)圖像進(jìn)行放大或縮小颈畸，有助于學(xué)習(xí)不同分辨率條件下的目標(biāo)特征乌奇；（7）加噪聲，對(duì)原始圖像加不同強(qiáng)度眯娱、不同類型（高斯白噪聲礁苗、斑點(diǎn)噪聲、椒鹽噪聲等等）的噪聲徙缴，有助于提高目標(biāo)檢測(cè)識(shí)別的魯棒性寂屏。下面以兩幅自然場(chǎng)景圖像與兩幅SAR遙感圖像為例，展示以上7種經(jīng)典圖像生成方法產(chǎn)生的結(jié)果娜搂。

當(dāng)然迁霎，在對(duì)MSTAR的處理中，我們不需將以上方式都用一遍百宇，我們可以操作的預(yù)處理形式包括：數(shù)值歸一化考廉、剪切變換、旋轉(zhuǎn)變換携御、縮放昌粤、水平翻轉(zhuǎn)。

3.2 Pre-training + Fine-tune

預(yù)訓(xùn)練+Fine-tune是常見的處理方式啄刹。

所謂預(yù)訓(xùn)練涮坐，需要區(qū)別于常規(guī)訓(xùn)練方法。常規(guī)訓(xùn)練方法為首先搭建一個(gè)深度網(wǎng)絡(luò)模型誓军，隨機(jī)初始化參數(shù)袱讹，然后開始訓(xùn)練網(wǎng)絡(luò)，不斷調(diào)整直到網(wǎng)絡(luò)的損失越來越小昵时。在訓(xùn)練的過程中捷雕，初始化的參數(shù)會(huì)不斷變化，直到達(dá)到所需識(shí)別結(jié)果壹甥。所謂預(yù)訓(xùn)練是指不在隨機(jī)初始化的參數(shù)開始訓(xùn)練網(wǎng)絡(luò)救巷，而是從已有訓(xùn)練好的模型參數(shù)開始訓(xùn)練網(wǎng)絡(luò)，比如我們可以把在ImageNet數(shù)據(jù)集上訓(xùn)練的模型ResNet50拿來句柠，用在新數(shù)據(jù)集的訓(xùn)練浦译，也就是針對(duì)本文所說的MSTAR數(shù)據(jù)集棒假。

????? 什么是Fine-tune？Fine-tune是一種常用的深度網(wǎng)絡(luò)訓(xùn)練技巧精盅，屬于遷移學(xué)習(xí)的一種淆衷，F(xiàn)ine-tune與預(yù)訓(xùn)練的方式結(jié)合。在利用已有模型訓(xùn)練新數(shù)據(jù)時(shí)渤弛，可以不必對(duì)全部層的參數(shù)進(jìn)行訓(xùn)練，而可以只對(duì)輸出層及接近輸出層的若干卷積層訓(xùn)練甚带，即固定低層參數(shù)而只訓(xùn)練高層參數(shù)她肯。這么做的原因是，網(wǎng)絡(luò)的低層只提取邊緣等基礎(chǔ)信息鹰贵，而這些信息晴氨，在各類數(shù)據(jù)中是相當(dāng)?shù)模瑹o需重復(fù)訓(xùn)練獲得碉输。高層參數(shù)則相對(duì)變化較大籽前，需要重新獲取。

????? 那如何操作呢敷钾，實(shí)際上python中很容易枝哄，特別是在采用Keras框架中，提供了即為便捷的方式阻荒。

????? 在Keras中挠锥，我們可以加載已訓(xùn)練好的ResNet50模型，這里侨赡，我們需要的是不含全連接層的版本：

WEIGHTS_PATH_NO_TOP = 'resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5'

????? 基于函數(shù)式編程蓖租，我們把全連接層設(shè)定256個(gè)節(jié)點(diǎn)，輸出層限定為10個(gè)類別：

x = Flatten()(x)

x = Dense(256,activation='relu')(x)

x = Dropout(0.5)(x)

x = Dense(10, activation = 'softmax')(x)

????? 限定模型前45個(gè)層的參數(shù)固定

for layer in model2.layers[:45]:

? ? ? layer.trainable= False

采用隨機(jī)梯度下降進(jìn)行優(yōu)化（似乎fine-tune時(shí)采用這個(gè)函數(shù)普遍結(jié)果好點(diǎn)）

model2.compile(loss='binary_crossentropy',?optimizer?=?SGD(lr=1e-3,momentum= 0.9), metrics=['accuracy'])

Keras提供了簡(jiǎn)潔的圖像預(yù)處理形式

train_datagen= ImageDataGenerator(

??????? rescale=1./255,

??????? shear_range=0.2,

??????? rotation_range=10.,

??????? zoom_range=0.2,

??????? horizontal_flip=True)

最后羊壹，設(shè)定epoch為200蓖宦，batch_size 大小為16。

完整代碼參見列表油猫。

結(jié)果如下：

我的機(jī)器配置是Intel Core I5 6500稠茂，顯卡GTX 960，內(nèi)存8GB情妖。每個(gè)epoch運(yùn)行約5分鐘主慰，在運(yùn)行了40余個(gè)epoch（不到4個(gè)小時(shí)）后，訓(xùn)練準(zhǔn)確率達(dá)到99.83%鲫售，此時(shí)在測(cè)試集上的驗(yàn)證結(jié)果為99.58%共螺。這個(gè)結(jié)果是什么水平呢？好在MSTAR的數(shù)據(jù)集是個(gè)應(yīng)用最廣的SAR圖像識(shí)別數(shù)據(jù)集情竹，每年都有不少算法在這上面跑藐不，2018年的論文《SAR Automatic Target Recognition Based on Multiview Deep Learning Framework》只達(dá)到98.5%，《Transfer Learning with Deep Convolutional Neural Network for SAR Target Classification with Limited Labeled Data》10類準(zhǔn)確率是98.5%，西工大杜蘭教授《SAR Automatic Target Recognition Based on Euclidean Distance Restricted Autoencoder》只達(dá)到不到96%的準(zhǔn)確率雏蛮，我們似乎已經(jīng)達(dá)到發(fā)表論文的水平了涎嚼！

全部代碼圖片在這里：

https://github.com/azy1988/ML-CV/tree/master/MSTAR_ATR

最后編輯于：2019.03.18 23:14:45

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市挑秉，隨后出現(xiàn)的幾起案子法梯，更是在濱河造成了極大的恐慌，老刑警劉巖犀概，帶你破解...
沈念sama閱讀 217,826評(píng)論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件立哑，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡姻灶，警方通過查閱死者的電腦和手機(jī)铛绰，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,968評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來产喉，“玉大人捂掰，你說我怎么就攤上這事≡颍” “怎么了这嚣？”我有些...
開封第一講書人閱讀 164,234評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)塞俱。經(jīng)常有香客問我疤苹，道長(zhǎng)，這世上最難降的妖魔是什么敛腌？我笑而不...
開封第一講書人閱讀 58,562評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任卧土，我火速辦了婚禮，結(jié)果婚禮上像樊，老公的妹妹穿的比我還像新娘尤莺。我一直安慰自己，他們只是感情好生棍，可當(dāng)我...
茶點(diǎn)故事閱讀 67,611評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布颤霎。她就那樣靜靜地躺著，像睡著了一般涂滴。火紅的嫁衣襯著肌膚如雪友酱。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,482評(píng)論 1贊 302
城市分裂傳說
那天柔纵，我揣著相機(jī)與錄音缔杉，去河邊找鬼。笑死搁料，一個(gè)胖子當(dāng)著我的面吹牛或详，可吹牛的內(nèi)容都是我干的系羞。我是一名探鬼主播，決...
沈念sama閱讀 40,271評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼霸琴，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼椒振！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起梧乘，我...
開封第一講書人閱讀 39,166評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤澎迎，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后选调，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體夹供，經(jīng)...
沈念sama閱讀 45,608評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,814評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年学歧，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片各吨。...
茶點(diǎn)故事閱讀 39,926評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡枝笨，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出揭蜒，到底是詐尸還是另有隱情横浑，我是刑警寧澤，帶...
沈念sama閱讀 35,644評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布屉更，位于F島的核電站徙融，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏瑰谜。R本人自食惡果不足惜欺冀，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,249評(píng)論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望萨脑。院中可真熱鬧隐轩，春花似錦、人聲如沸渤早。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,866評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽鹊杖。三九已至悴灵，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間骂蓖，已是汗流浹背积瞒。一陣腳步聲響...
開封第一講書人閱讀 32,991評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國(guó)打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留登下，地道東北人赡鲜。一個(gè)月前我還...
沈念sama閱讀 48,063評(píng)論 3贊 370
代替公主和親
正文我出身青樓告抄，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親歇万。傳聞我的和親對(duì)象是個(gè)殘疾皇子凝颇，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,871評(píng)論 2贊 354

如何在MSTAR SAR圖像目標(biāo)識(shí)別數(shù)據(jù)集中刷出99.5%的準(zhǔn)確率眷柔？