簡介
本次實(shí)驗(yàn)的目的是對(duì)眼底圖像進(jìn)行分類識(shí)別沛豌,數(shù)據(jù)的標(biāo)簽分為【0加派,1,2竹勉,3娄琉,4】五類次乓,分別代表糖尿病視網(wǎng)膜病變的5個(gè)階段,0為健康孽水,4為最嚴(yán)重票腰。
我們的任務(wù)就是利用深度學(xué)習(xí)根據(jù)訓(xùn)練集訓(xùn)練模型,對(duì)測(cè)試集的數(shù)據(jù)進(jìn)行預(yù)測(cè)分類女气,達(dá)到盡可能高的準(zhǔn)確率杏慰。
原始數(shù)據(jù)集
- train set
包括 35126 張眼底圖像的數(shù)據(jù),分辨率不一炼鞠,質(zhì)量不一缘滥。
劃分出其中的10%作為validation set。 - test set
包括 53576 張眼底圖像的數(shù)據(jù)谒主,但是kaggle并未給出label朝扼,kaggle根據(jù)對(duì)這個(gè)測(cè)試集結(jié)果的評(píng)判來給出比賽的得分。
圖像預(yù)處理
- resize
以圖像中的圓形眼底圖片為邊界進(jìn)行裁剪霎肯,取中心部分肠仪。
調(diào)整分辨率分別為128x128,256x256,512x512,用于之后的訓(xùn)練。 - Data augmentation
通過360度旋轉(zhuǎn)潮针,鏡像等擴(kuò)增數(shù)據(jù)集。
網(wǎng)絡(luò)結(jié)構(gòu)
為了減少訓(xùn)練時(shí)間舱权,只選用了一個(gè)網(wǎng)絡(luò)net B進(jìn)行訓(xùn)練
使用10%的train set作為validation set
用128x128像素圖片訓(xùn)練1-11 和 20-25層张症。
用256x256像素圖片訓(xùn)練1-15 和 20-25層。初始時(shí),使用上一次訓(xùn)練得到的權(quán)重作為1-11層的權(quán)重涯保。
用512x512像素圖片訓(xùn)練全部層。初始時(shí)片排,使用上一次訓(xùn)練得到的權(quán)重作為1-15層的權(quán)重。
最后得到三組權(quán)重(weights)
[best kappa weight, best validation score weight, final weight]
特征提取
從 RMSPooling Layer提取特征。為了提升質(zhì)量,重復(fù)進(jìn)行20次特征提取庙楚,但是使用的是隨機(jī)的data argumentation。然后在20次循環(huán)之后提取出 RMSPooling Layer的平均值和標(biāo)準(zhǔn)差,作為下一層blend network的輸入塞祈。
左右眼混合
對(duì)于每個(gè)病人,使用下面的特征作為網(wǎng)絡(luò)的輸入
[this_eye_mean, other_eye_mean, this_eye_std, other_eye_std, right_eye_indicator]
訓(xùn)練一個(gè)簡單的全連接神經(jīng)網(wǎng)絡(luò)斯议。
網(wǎng)絡(luò)結(jié)構(gòu):
Input 8193
Dense 32
Maxout 16
Dense 32
Maxout 16
```
根據(jù)上文訓(xùn)練的三組weights焊唬,會(huì)生成三個(gè)blend network。然后對(duì)這三個(gè)network的輸出取平均值嗦哆,并且設(shè)置閾值為[0.5,1.5额湘,2.5,3.5]來生成最終的分類結(jié)果绽快。
## 評(píng)分標(biāo)準(zhǔn)
kaggle對(duì)此比賽的評(píng)分基于 quadratic weighted kappa 算法擅耽。得分范圍為0-1憾儒,分?jǐn)?shù)越高證明模型的效果越好警儒。
簡單地說就是對(duì)于多分類問題,預(yù)測(cè)的越不準(zhǔn)得分越低,比如把class=0預(yù)測(cè)成class=4的懲罰會(huì)比把class=0預(yù)測(cè)成class=1的懲罰重很多别伏,進(jìn)行隨機(jī)預(yù)測(cè)的得分約為0睦番。
具體的算法實(shí)現(xiàn)內(nèi)容參見[此鏈接](https://www.kaggle.com/c/diabetic-retinopathy-detection/details/evaluation)
## 實(shí)驗(yàn)結(jié)果
提交到kaggle進(jìn)行評(píng)分,結(jié)果為8.42,略低于原隊(duì)伍的8.44,但是考慮到我們所大幅度簡化的網(wǎng)絡(luò),實(shí)際得到的結(jié)果還是不錯(cuò)的窍株。
validation set的confusion matrix如下:
![confusion matrix](http://upload-images.jianshu.io/upload_images/2563527-e190e0077b75e00d.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
可以看到辙售,對(duì)于糖尿病視網(wǎng)膜病變的識(shí)別率能達(dá)到約92%左右士八,誤報(bào)率為8%左右醋虏。
整個(gè)訓(xùn)練耗時(shí)約30+小時(shí)阻课,使用一塊GTX1080顯卡署驻。