論文:MICCAI BrainLesion Workshop 2020
代碼:pytorch--BrainTumorSegmentation
Abstract
三維核磁共振圖像(MRIs)中腦腫瘤分割的自動(dòng)化是評估該病診斷和治療的關(guān)鍵。近年來,卷積神經(jīng)網(wǎng)絡(luò)在這一課題中取得了較好的效果狼讨。然而乒躺,在三維cnn中轮洋,內(nèi)存消耗量高仍然是一個(gè)問題。而且,大多數(shù)方法都不包含不確定性信息,這在醫(yī)學(xué)診斷中尤為重要晾咪。本文是3D encoder-decoder的結(jié)構(gòu),采用基于patch方法訓(xùn)練 贮配,以減少內(nèi)存消耗谍倦,減少不平衡數(shù)據(jù)的影響。然后牧嫉,使用不同的訓(xùn)練模型創(chuàng)建一個(gè)集成剂跟,利用每個(gè)模型的屬性,從而提高性能酣藻。此外,提出了一種混合分割方法鳍置,提高了分割的準(zhǔn)確性辽剧。數(shù)據(jù)集為BraTS 2020。
Method
數(shù)據(jù)集統(tǒng)計(jì)
腦腫瘤分割的最大復(fù)雜性來自于類的不平衡税产。腫瘤區(qū)域占腦組織的5-15%怕轿,每個(gè)腫瘤區(qū)域的比例更小。圖1提供了每個(gè)腫瘤類別的分布的圖示:ET辟拷、NCR撞羽、ED;沒有健康的組織衫冻【魑桑可以看出,ED比ET和NCR更可能發(fā)生隅俘,NCR標(biāo)簽中受試者之間的差異很大邻奠。另一個(gè)復(fù)雜性是膠質(zhì)瘤分級之間的差異,因?yàn)長GG患者的特點(diǎn)是血液濃度低为居,轉(zhuǎn)化為ET體素出現(xiàn)率低碌宴,NCR和NET區(qū)域的體素?cái)?shù)量較多。
Data Pre-processing and Augmentation
MRI強(qiáng)度值沒有標(biāo)準(zhǔn)化,因?yàn)閿?shù)據(jù)來自不同的機(jī)構(gòu)干跛、掃描儀和協(xié)議子姜。因此,我們將每個(gè)患者的每一個(gè)模態(tài)獨(dú)立地標(biāo)準(zhǔn)化楼入,使其僅基于代表大腦區(qū)域的非零體素具有零均值和單位std哥捕。
我們還應(yīng)用了數(shù)據(jù)擴(kuò)充技術(shù),通過盡量減少對數(shù)據(jù)的破壞來防止過度擬合嘉熊。為此遥赚,我們以50%的概率應(yīng)用隨機(jī)翻轉(zhuǎn)(所有3個(gè)軸),以50%的概率在兩個(gè)軸上旋轉(zhuǎn)90°阐肤,Random Intensity Shift between (?0.1..0.1 of data std) and Random Intensity
Scale on all input channels at range (0.9..1.1).凫佛。
Sampling Strategy
三維cnn的計(jì)算成本很高,而且在許多情況下孕惜,輸入數(shù)據(jù)不能直接傳送到網(wǎng)絡(luò)愧薛。基于Patch訓(xùn)練有助于釋放內(nèi)存資源衫画,以便在一批中輸入更多圖像毫炉。但是,Patch大小和批處理大小之間有一個(gè)權(quán)衡削罩。更大的批將有更準(zhǔn)確的數(shù)據(jù)表示瞄勾,但需要更小的Patch(由于內(nèi)存限制),提供本地信息弥激,但缺乏上下文知識进陡。
在這項(xiàng)工作中,我們根據(jù)補(bǔ)丁大小使用了兩種方法微服。
–二元分布:隨機(jī)選擇小于等于的小Patch趾疚,50%的概率集中在健康組織上,50%的概率集中在腫瘤上[10]职辨。
–隨機(jī)腫瘤分布:隨機(jī)選擇較大的大小盗蟆,或
,但始終集中在腫瘤區(qū)域舒裤,因?yàn)镻atch將包含更多健康組織和背景信息喳资。
Loss
Generalized Dice Loss (GDL)
Network Architecture
這項(xiàng)工作提出了三種網(wǎng)絡(luò),即V-Net和3DU-Net結(jié)構(gòu)的變體腾供,用于腦腫瘤分割仆邓,并創(chuàng)建了一個(gè)集成來減輕每個(gè)獨(dú)立模型中的偏差鲜滩。
V-Net實(shí)現(xiàn)已經(jīng)被調(diào)整為使用四個(gè)輸出通道(Non-Tumor、ED节值、NCR/Net徙硅、ET),并使用 Instance Normalization搞疗,與Batch Normalization形成對比嗓蘑,Instance Normalization是針對每個(gè)訓(xùn)練示例而不是整個(gè)批處理跨每個(gè)通道進(jìn)行規(guī)范化。我們已經(jīng)將最高分辨率下的特征映射數(shù)量增加到32個(gè)匿乃,而不是最初實(shí)現(xiàn)中提出的16個(gè)桩皿。圖2顯示了輸入補(bǔ)丁大小為64x64x64的網(wǎng)絡(luò)體系結(jié)構(gòu)。
V-Net實(shí)際使用的Patch大小和隨機(jī)腫瘤分布策略進(jìn)行訓(xùn)練幢炸,batch size = 2
3D-UNet我們使用了原始的實(shí)現(xiàn)泄隔,只是做了一些小的修改。BN改為GN宛徊,并且佛嬉,和V-Net一樣,我們使用了32個(gè)最高分辨率的特征圖闸天。
網(wǎng)絡(luò)結(jié)構(gòu)分為對稱編碼器和解碼器兩部分暖呕。編碼器由兩個(gè)卷積塊組成,采用3DConv+ReLu+GroupNorm結(jié)構(gòu)号枕。使用2x2x2 MaxPooling執(zhí)行下采樣缰揪,使用插值執(zhí)行相應(yīng)的上采樣。所有卷積層的內(nèi)核大小均為3葱淳,但最后一個(gè)層的內(nèi)核大小為1x1x1,并輸出4個(gè)特征映射抛姑。在這種情況下赞厕,我們使用ReLu非線性,concat拼接定硝。該網(wǎng)絡(luò)輸出一個(gè)帶有訓(xùn)練標(biāo)簽的四通道分割圖以及一個(gè)softmax皿桑。詳細(xì)的體系結(jié)構(gòu)如圖3所示。
Basic 3D-UNet 實(shí)際使用的Patch大小和隨機(jī)腫瘤分布策略進(jìn)行訓(xùn)練蔬啡,batch size = 2
Residual 3D-UNet 通過殘差連接擴(kuò)展了先前的網(wǎng)絡(luò)诲侮,以允許具有較深的網(wǎng)絡(luò),并且減小了梯度消失的風(fēng)險(xiǎn)箱蟆。在加入殘差模塊的基礎(chǔ)上沟绪,該網(wǎng)絡(luò)還引入了對Basic 3D-UNet的一些修改:(1)add;(2)轉(zhuǎn)置卷積空猜;(3)由于resnet連接绽慈,它增加了網(wǎng)絡(luò)的深度恨旱。
這個(gè)網(wǎng)絡(luò)是按照兩種不同的策略訓(xùn)練的。
第一種方法坝疼,Residual 3D-UNet在整個(gè)訓(xùn)練過程中使用的Patch大小和隨機(jī)腫瘤分布策略進(jìn)行訓(xùn)練搜贤,batch size = 2。
第二種方法钝凶, 3D-UNet-residual-multiscale改變了采樣策略仪芒,使得網(wǎng)絡(luò)能夠看到局部和全局信息。為此耕陷,訓(xùn)練的前半部分使用個(gè)補(bǔ)丁大小掂名,batch size =1。然后啃炸,將補(bǔ)丁大小減少到
铆隘,batch size = 2。
Post-Processing
為了糾正以小的和分離的連接成分的形式出現(xiàn)的假陽性南用,本工作使用了一個(gè)后處理步驟膀钠,如果兩個(gè)最大的連接成分的比例大于通過分析訓(xùn)練集獲得的某個(gè)閾值,則保留它們裹虫。在這個(gè)過程中肿嘲,可能是假陽性的小連接成分被移除,但足夠大的成分被保留筑公,因?yàn)橐恍┦茉囌呖赡苡袔讉€(gè)腫瘤雳窟。
此外,這一挑戰(zhàn)的最大困難之一是提供最小子區(qū)域ET的精確分割匣屡,這在LGG患者中尤其困難封救,因?yàn)閹缀?0%的患者在訓(xùn)練集中沒有增強(qiáng)腫瘤。在評估步驟中捣作,如果基本事實(shí)和預(yù)測中都沒有標(biāo)簽誉结,BraTS會給骰子1分。相反地券躁,在一個(gè)沒有增強(qiáng)腫瘤的患者中惩坑,只有一個(gè)假陽性體素會導(dǎo)致骰子得分為0。因此也拜,以前的一些工作[15以舒,16]建議,如果增強(qiáng)體素的總數(shù)小于某個(gè)閾值慢哈,則替換增強(qiáng)腫瘤體素來進(jìn)行壞死蔓钟,每個(gè)實(shí)驗(yàn)都是獨(dú)立的。然而岸军,我們無法找到一個(gè)閾值來改善表現(xiàn)奋刽,因?yàn)樗兄谝恍┦茉囌咄呶辏蛊渌恍┙Y(jié)果更糟。