密歇根大學(xué) 2016
摘要?
設(shè)計(jì)了一種深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(DLCNN),用于將在預(yù)篩選階段檢測(cè)到的微鈣化候選物區(qū)分為在計(jì)算機(jī)輔助檢測(cè)(CAD)系統(tǒng)中用于聚集微鈣化的真正鈣化或假陽(yáng)性。從由多尺度雙邊濾波重建的數(shù)字乳房斷層合成體積生成的平面投影圖像中提取微鈣化候選者正則化的同時(shí)代數(shù)重建技術(shù)。對(duì)于DLCNN的訓(xùn)練和測(cè)試循签,對(duì)于數(shù)據(jù)集手動(dòng)標(biāo)記真正的微鈣化點(diǎn),并且在排除真正的微鈣化之后,從CAD系統(tǒng)鑒定的候選對(duì)象在預(yù)篩選中獲得假陽(yáng)性勤哗。通過(guò)改變卷積層中的濾波器數(shù)目,濾波器核心大小和梯度計(jì)算參數(shù)來(lái)選擇DLCNN體系結(jié)構(gòu)掩驱,得到216個(gè)組合的參數(shù)空間芒划。在所研究的參數(shù)空間內(nèi)采用窮舉網(wǎng)格搜索方法來(lái)選擇最佳的體系結(jié)構(gòu),并以受試者工作特性曲線(AUC)下的面積為指標(biāo)進(jìn)行指導(dǎo)欧穴。分析了不同類別參數(shù)空間的影響民逼。選定的DLCNN與我們以前設(shè)計(jì)的CNN架構(gòu)進(jìn)行了比較。 CNN和DLCNN的AUC分別為0.89和0.93涮帘。改善有統(tǒng)計(jì)學(xué)意義(p <0.05)拼苍。
1.引言
卷積神經(jīng)網(wǎng)絡(luò)(CNN)以前已被用于在計(jì)算機(jī)輔助檢測(cè)(CAD)中識(shí)別用于屏幕膜乳房攝影,1數(shù)字乳腺攝影(DM)2和數(shù)字乳腺斷層合成(DBT)3-5的成簇微鈣化的微鈣化调缨,來(lái)自乳房X線照相的正常乳房組織的腫塊[6]疮鲫。CNN已經(jīng)被證明可用于區(qū)分微小鈣化與纖維組織結(jié)構(gòu)或金屬夾之間的平面間偽影。隨著近年來(lái)計(jì)算能力和數(shù)據(jù)存儲(chǔ)成本的不斷提高弦叶,大規(guī)模數(shù)據(jù)樣本訓(xùn)練巨大的CNN結(jié)構(gòu)成為可能俊犯。深度學(xué)習(xí)CNN(DLCNN)方法已經(jīng)被證明可以有效地識(shí)別各種類型的圖像中的模式[7-11]。與傳統(tǒng)的CNN架構(gòu)相比伤哺,DLCNN通過(guò)更多的層和節(jié)點(diǎn)來(lái)學(xué)習(xí)復(fù)雜的模式燕侠。在本研究中者祖,我們?cè)u(píng)估了DLCNN在DBT中CAD系統(tǒng)的真假微鈣化分化中的應(yīng)用。我們選擇了DLCNN的最佳體系結(jié)構(gòu)绢彤,分析了參數(shù)對(duì)分類性能的影響咸包,并與之前選擇的用于屏幕膠片乳房X線照片和DM的CNN體??系結(jié)構(gòu)相比較。
2 方法
2.1數(shù)據(jù)集
在這項(xiàng)研究中杖虾,使用了64個(gè)DBT病例烂瘫,并有微小的鈣化灶。數(shù)據(jù)集包含64個(gè)顱尾(CC)和63個(gè)側(cè)偏(MLO)視圖奇适。使用多尺度雙邊濾波(MSBF)正則化的同時(shí)代數(shù)重建技(SART)重建DBT體積坟比,平面分辨率為0.1 mm×0.1 mm,切片間距為1 mm嚷往。DBT體積分解為使用拉普拉斯金字塔分解的高頻和低頻量葛账,并且每個(gè)切片的高頻分量被雙邊濾波去噪。高頻體積的最大強(qiáng)度投影產(chǎn)生平面投影(PPJ)圖像皮仁。從PPJ圖像中提取以預(yù)篩選階段中識(shí)別的每個(gè)個(gè)體微鈣化候選為中心的16×16像素的感興趣區(qū)域(ROI)籍琳。
2.2計(jì)算機(jī)輔助檢測(cè)系統(tǒng)
我們的CAD系統(tǒng)的處理步驟包括使用迭代閾值和區(qū)域增長(zhǎng)來(lái)檢測(cè)微鈣化候選者,其次是聚類和假正減少(FP)贷祈。我們以前選擇的CNN架構(gòu)具有兩個(gè)隱藏層趋急,輸入和輸出層固定在一個(gè)節(jié)點(diǎn)組。 隱含層分別由12個(gè)和8個(gè)濾波器核大小為5和3的節(jié)點(diǎn)組構(gòu)成势誊。本文將CNN架構(gòu)的分類性能與DLCNN的性能進(jìn)行了比較呜达。
為了對(duì)CNN和DLCNN進(jìn)行訓(xùn)練和測(cè)試,數(shù)據(jù)集中的真正微鈣化由乳房成像經(jīng)驗(yàn)豐富的醫(yī)學(xué)物理學(xué)家手動(dòng)標(biāo)記粟耻。 將由CAD系統(tǒng)檢測(cè)到的與手動(dòng)標(biāo)記的位置不重疊的微鈣化候選物用作FP對(duì)象查近。 對(duì)象被分成獨(dú)立的訓(xùn)練和測(cè)試集。 為了增加訓(xùn)練樣本的種類挤忙,每個(gè)真實(shí)微鈣化的ROI被旋轉(zhuǎn)并翻轉(zhuǎn)以產(chǎn)生八種模式霜威。 由于FP對(duì)象比真正的微鈣化點(diǎn)多得多,所以FP對(duì)象是從可用的FP中隨機(jī)抽取的册烈,因此真假對(duì)象的ROI近似平衡戈泼。 共有4808個(gè)由2352個(gè)TP和2440個(gè)FP組成的對(duì)象被用于訓(xùn)練,并且使用了包括414個(gè)TP和1806個(gè)FP的2220個(gè)對(duì)象用于測(cè)試茄厘。 以微鈣化和FP對(duì)象為中心的ROI示例如圖1所示矮冬。
2.3選擇最佳的架構(gòu)
圖1顯示了用于這項(xiàng)研究的DLCNN16的結(jié)構(gòu)窑滞。 2.由于圖像模式在我們的應(yīng)用中相對(duì)簡(jiǎn)單琼牧,訓(xùn)練樣本數(shù)量有限恢筝,我們選擇了一個(gè)簡(jiǎn)單的結(jié)構(gòu),只有兩個(gè)卷積層巨坊,連接到兩個(gè)局部連接層和一個(gè)完全連接層撬槽。大小為2的最大匯聚層將第一卷積層的輸出下采樣到大小的一半。在每個(gè)卷積層之后實(shí)施標(biāo)準(zhǔn)化層以補(bǔ)償由于微鈣化和金屬物體造成的對(duì)比度的可能的大的變化趾撵。參數(shù)搜索空間包括表1中列出的參數(shù)范圍侄柔。使用詳盡的網(wǎng)格搜索方法來(lái)選擇DLCNN的最佳體系結(jié)構(gòu)。根據(jù)表1中的參數(shù)組合占调,共有216個(gè)DLCNN體系結(jié)構(gòu)進(jìn)行了培訓(xùn)和測(cè)試暂题。 C1,C2究珊,L1和L2的濾波器數(shù)目固定為16或32或64.部分和參數(shù)影響反向傳播階段的權(quán)重梯度計(jì)算薪者。參數(shù)(??)的可能組合取決于濾波器的輸出大小(??)剿涮,由given????*??給出言津,????= 0;例如,對(duì)于32的輸出大小取试,參數(shù)可以是1,2,4,8,16或32悬槽。
結(jié)果
根據(jù)受試者工作特征(ROC)曲線下面積(AUC)比較訓(xùn)練的DLCNN和CNN對(duì)測(cè)試集中真實(shí)微鈣化和假陽(yáng)性分類的表現(xiàn)。 對(duì)于搜索空間中所有可能的參數(shù)組合瑟蜈,按其值從低到高排序的AUC繪制在圖3中。 對(duì)于(32,32,32,32)濾波器的數(shù)量渣窜,對(duì)于兩個(gè)卷積層铺根,濾波器核大小分別為5和5,部分和值分別為18,16乔宿,得到最佳的AUC為0.933位迂。 對(duì)于相同的組合,部分和參數(shù)的變化如圖4所示详瑞。 圖5分析了每類濾波器的AUC變化掂林。圖6比較了CNN和DLCNN測(cè)試集的ROC曲線。 改善有統(tǒng)計(jì)學(xué)意義(p <0.05)坝橡。
4.討論與結(jié)論
選擇DLCNN體系結(jié)構(gòu)并不是一個(gè)微不足道的問(wèn)題,因?yàn)槊總€(gè)參數(shù)集的訓(xùn)練和測(cè)試都有大量的參數(shù)和長(zhǎng)的計(jì)算時(shí)間踱蠢。我們通過(guò)為DBT中的微鈣化檢測(cè)問(wèn)題選擇固定數(shù)量的層的參數(shù)范圍和組合來(lái)限制搜索空間的大小火欧。所選參數(shù)空間允許窮舉搜索最優(yōu)DLCNN體系結(jié)構(gòu)。觀察到茎截,隨著過(guò)濾器數(shù)量的增加布隔,AUC的變化也增加。當(dāng)部分和參數(shù)變化時(shí)稼虎,沒(méi)有觀察到趨勢(shì)衅檀,這可能是由于機(jī)器學(xué)習(xí)方法的非線性性質(zhì)。今后霎俩,我們計(jì)劃增加微鈣化的樣本量哀军,并探索自動(dòng)優(yōu)化方法,如遺傳算法或模擬退火打却。我們還將擴(kuò)大參數(shù)搜索空間杉适,以包括不同層次的濾波器數(shù)量的變化。已經(jīng)在重建的體積柳击,18-22投影視圖猿推,21,23-25 PPJ圖像,3,26或上述方法的組合中開(kāi)發(fā)了用于DBT中的微鈣化團(tuán)塊的CAD的實(shí)現(xiàn)捌肴。我們將探索DLCNN在不同的圖像的類型蹬叭。