英文題目:Deep Learning for Medical Anomaly Detection - A Survey
中文題目:深度學(xué)習(xí)的醫(yī)療異常檢測(cè)綜述
論文地址:https://arxiv.org/pdf/2012.02364.pdf
領(lǐng)域:深度學(xué)習(xí),異常檢測(cè)
發(fā)表時(shí)間:2021.04
作者:Tharindu Fernando,澳大利亞昆士蘭科技大學(xué)
出處:ACM Computing Surveys
被引量:1024(谷歌學(xué)術(shù))
代碼和數(shù)據(jù):
閱讀時(shí)間:22.11.09
讀后感
主要討論在醫(yī)療數(shù)據(jù)中使用深度學(xué)習(xí)方法琼娘,以處理影像數(shù)據(jù)顽聂,時(shí)間序列為主炫乓,同時(shí)討論了醫(yī)學(xué)數(shù)據(jù)一些特有的屬性猪勇。
I. 介紹
A. 什么是異常
異常檢測(cè)的主要任務(wù)是識(shí)別不符合總體數(shù)據(jù)分布的數(shù)據(jù)樣本。在醫(yī)療領(lǐng)域倡缠,除了建模以外攒菠,對(duì)模型的解釋也至關(guān)重要迫皱。在實(shí)際應(yīng)用中,對(duì)異常的定義也比較復(fù)雜辖众,比如行為的不一致性卓起;區(qū)分噪聲與異常;還需要考慮上下文對(duì)異常的影響凹炸。
B. 醫(yī)療異常的不同
模型在醫(yī)療領(lǐng)域的應(yīng)用包括兩部分:診斷(識(shí)別當(dāng)前狀態(tài))和預(yù)測(cè)(未來(lái)的狀態(tài))戏阅,這兩部分都可能發(fā)生異常。
它要求:當(dāng)對(duì)正常樣本建模時(shí)啤它,模型應(yīng)該能夠表示正常數(shù)據(jù)分布的多樣性饲握;模型需要足夠的靈敏度(正確識(shí)別異常樣本的能力)私杜,要求異常檢測(cè)模型具有較高的準(zhǔn)確性;另外救欧,正常樣本之間也可能存在差異,比如在成人和兒童靜息狀態(tài)腦電圖數(shù)據(jù)的顯著差異; 醫(yī)學(xué)異常檢測(cè)通常以監(jiān)督學(xué)習(xí)任務(wù)為主锣光。
C. 使用深度學(xué)習(xí)
深度學(xué)習(xí)可以更好地處理非線性數(shù)據(jù)笆怠;并有可以自動(dòng)構(gòu)造特征;支持一些自動(dòng)識(shí)別功能誊爹,避免了一些手工標(biāo)注異常蹬刷;還可以針對(duì)時(shí)序了數(shù)據(jù)識(shí)別長(zhǎng)距離的依賴(lài)關(guān)系(如LSTM)。
D. 本文貢獻(xiàn)
本文涉及多種醫(yī)療異常建模方法频丘,讀者可以比較和對(duì)比不同深度學(xué)習(xí)技術(shù)的優(yōu)缺點(diǎn)办成,并將這些發(fā)現(xiàn)用于不同的醫(yī)療應(yīng)用領(lǐng)域。涉及卷積神經(jīng)網(wǎng)絡(luò)搂漠,循環(huán)神經(jīng)網(wǎng)絡(luò)迂卢,生成對(duì)抗網(wǎng)絡(luò),自動(dòng)編碼器桐汤,神經(jīng)記憶網(wǎng)絡(luò)而克,支持無(wú)監(jiān)督學(xué)習(xí)、監(jiān)督學(xué)習(xí)和多任務(wù)學(xué)習(xí)怔毛。另外员萍,還討論了解釋模型決策的方法。
E. 本文組織方式
第II部分算法拣度,其中II-A介紹醫(yī)療數(shù)據(jù)類(lèi)型碎绎,II-B介紹算法,II-C介紹應(yīng)用場(chǎng)景抗果;第III部分是模型解釋?zhuān)坏贗V部分是挑戰(zhàn)與限制筋帖;第V部分總結(jié)。
II. 使用深度學(xué)習(xí)檢測(cè)醫(yī)療異常
A. 數(shù)據(jù)類(lèi)型
1) 生物醫(yī)學(xué)圖像
- X光片:原理是骨骼中的鈣密度更大窖张,會(huì)散射x射線幕随。通常用于各種診斷目的,包括檢測(cè)骨折宿接、牙齒問(wèn)題赘淮、肺炎和某些類(lèi)型的腫瘤。
- CT 計(jì)算機(jī)斷層掃描:收集了多個(gè)橫截面成像睦霎,常用于檢測(cè)腹部腫瘤或病變梢卸,定位頭部損傷、腫瘤和血塊副女,診斷復(fù)雜的骨折和骨腫瘤蛤高。
- MRI 核磁:原理是不同類(lèi)型的組織釋放的能量不同,這使得核磁共振掃描能夠分離出不同的區(qū)域。通常用于人體非骨或軟組織區(qū)域的成像戴陡,比如:顯示大腦塞绿,脊髓,神經(jīng)和肌肉恤批,腦腫瘤的檢測(cè)和組織損傷的識(shí)別异吻。
2) 電子生物醫(yī)學(xué)信號(hào)
- ECG 心電圖:一種可視化的工具,可以觀察產(chǎn)生心跳的流經(jīng)心臟的電流喜庞。它通過(guò)測(cè)量心電圖上的時(shí)間間隔诀浪,可以篩選出不規(guī)律的電活動(dòng);電活動(dòng)的強(qiáng)度可以反映心臟的哪些區(qū)域工作過(guò)度或壓力過(guò)大延都。
- EEG 腦電圖:檢測(cè)大腦中的電活動(dòng)雷猪,利用電脈沖進(jìn)行交流。常用于研究睡眠模式晰房、心理障礙求摇、頭部損傷造成的腦損傷和癲癇。
- MEG腦磁圖:主要檢測(cè)由這些細(xì)胞外電流引起的磁場(chǎng)嫉你。
3)雜項(xiàng)數(shù)據(jù)類(lèi)型
如心音描記術(shù)(PCG)和其它可穿戴醫(yī)療設(shè)備月帝。
B.醫(yī)療異常檢測(cè)算法方法
1)無(wú)監(jiān)督異常檢測(cè)
自編碼器AEs
Auto Encoders,可以自已學(xué)習(xí)特征幽污。對(duì)它的改進(jìn)包含離散自編碼器嚷辅,它通過(guò)懲罰對(duì)非0值的加和使特征足夠稀疏。
另外距误,還有去噪自編碼器簸搞,壓縮自編碼器;其中變分自編碼器得到了很廣泛的應(yīng)用准潭,它假設(shè)觀測(cè)值x從概率分布中采樣趁俊,并試圖估計(jì)該分布的參數(shù)(引入了概率)。
自編碼器的弱點(diǎn)是刑然,對(duì)于高維數(shù)據(jù)分布寺擂,編碼能力受限,經(jīng)常導(dǎo)致錯(cuò)誤的重構(gòu)和不準(zhǔn)確的近似建模數(shù)據(jù)分布泼掠。
生成對(duì)抗網(wǎng)絡(luò)GANs
一個(gè)生成器怔软,一個(gè)判別器,也有很多改進(jìn)版本择镇,其中條件GAN使用最為廣泛挡逼,還有Cycle-GAN在圖像翻譯任務(wù)中比較流行,它的原始輸入可以由生成的輸出合成腻豌。
判別器主要用于判別真?zhèn)渭铱玻鞘欠癞惓V瞿堋>唧w使用的一種方法是:當(dāng)生成圖和目標(biāo)圖出現(xiàn)差異時(shí),認(rèn)為異常虱疏,并使用該過(guò)程識(shí)別異常惹骂。
2) 有監(jiān)督的異常檢測(cè)
在監(jiān)督異常檢測(cè)中,提供一個(gè)監(jiān)督信號(hào)订框,指示哪些示例來(lái)自正常類(lèi)別析苫,哪些是異常的。
多任務(wù)學(xué)習(xí)是其中一個(gè)重要應(yīng)用:它在多個(gè)相關(guān)任務(wù)之間共享相關(guān)信息穿扳,而不是單獨(dú)學(xué)習(xí)它們。在學(xué)習(xí)異常分類(lèi)的過(guò)程中国旷,研究對(duì)象之間的異同矛物,相對(duì)于主題的變化。
3) 循環(huán)神經(jīng)網(wǎng)絡(luò)
由于時(shí)序信處在醫(yī)療數(shù)據(jù)中廣泛使用跪但,它主要使用歷史數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)數(shù)據(jù)履羞,因此,此處把它單獨(dú)歸成一類(lèi)屡久。深度學(xué)習(xí)方法包含:RNN忆首,LSTM,GRU等被环。其中NMNs(Neural Memory Networks)神經(jīng)記憶網(wǎng)絡(luò)是RNN的另一種變體糙及,它使用一個(gè)外部存儲(chǔ)器堆棧來(lái)存儲(chǔ)信息,LSTM遺忘門(mén)和寫(xiě)控制器相似筛欢〗牵可用于如識(shí)別腦電圖預(yù)測(cè)癲癇發(fā)作。
C. 背景和相關(guān)應(yīng)用
1)檢測(cè)MRI異常
概括起來(lái)大致分兩種:一種是使用深度學(xué)習(xí)作為特征提取器版姑,后面接隨機(jī)森林柱搜、SVM等機(jī)器學(xué)習(xí)算法做異常檢測(cè);另一種是深度學(xué)習(xí)網(wǎng)絡(luò)后面接Softmax直接預(yù)測(cè)異常和類(lèi)別剥险。
具體的深度學(xué)習(xí)模型大多數(shù)使用CNN聪蘸;也有使用自編碼器作為特征提取器,后接機(jī)器學(xué)習(xí)模型的表制;還有分兩步訓(xùn)練健爬,第一步先訓(xùn)練無(wú)監(jiān)督AE學(xué)習(xí)特征,第二步用有監(jiān)督方法加一個(gè)Softmax層利用有標(biāo)簽數(shù)據(jù)優(yōu)化夫凸。(結(jié)合有監(jiān)督和無(wú)監(jiān)督)
另外浑劳,還有多尺度多任務(wù)的框架,實(shí)現(xiàn)腰椎神經(jīng)孔狹窄癥的診斷夭拌,在不同的尺度上捕捉多個(gè)器官魔熏;多任務(wù)是在回歸邊界框定位器官和預(yù)測(cè)所定位器官的異常衷咽。
還有利用NMN方法,將內(nèi)存堆棧存儲(chǔ)作為區(qū)分正常和異常樣本的重要特征蒜绽。
2) 在內(nèi)窺鏡檢查數(shù)據(jù)中發(fā)現(xiàn)異常
CNN是內(nèi)鏡圖像異常檢測(cè)的主要方法镶骗。多分類(lèi)通常使用分類(lèi)交叉熵?fù)p失訓(xùn)練,使模型可以檢測(cè)正常和異常的例子躲雅,同時(shí)識(shí)別異常類(lèi)別鼎姊。
3) 心音異常檢測(cè)
主要處理音頻信號(hào),一般結(jié)合深度學(xué)習(xí)和手工提取特征相赁,包含時(shí)域特征相寇、高階統(tǒng)計(jì)量、信號(hào)能量和頻域特征钮科,如梅爾譜圖和梅爾頻率倒譜唤衫;同時(shí)使用1D-CNN或者RNN建模。這些方法能有效地對(duì) S1和S2心音位置周?chē)男畔⒚喔詸z測(cè)異常佳励。該領(lǐng)域主要使用有監(jiān)督數(shù)據(jù)建模。
4) 癲癇發(fā)作預(yù)測(cè)
對(duì)于不均衡數(shù)據(jù)蛆挫,首先使用平衡數(shù)據(jù)集訓(xùn)練模型赃承,數(shù)據(jù)集包含等量的預(yù)測(cè)數(shù)據(jù)和間隔數(shù)據(jù)。當(dāng)系統(tǒng)部署時(shí)悴侵,建議添加一個(gè)可調(diào)處理層瞧剖,可以根據(jù)用戶(hù)的需求進(jìn)行優(yōu)化。這種方法很實(shí)用
還有一種對(duì)抗學(xué)習(xí)的方法畜挨,修改了網(wǎng)絡(luò)結(jié)構(gòu)筒繁,添加兩個(gè)全連接層來(lái)調(diào)整鑒別器網(wǎng)絡(luò),以便訓(xùn)練它執(zhí)行正常/異常分類(lèi)巴元,而不是真/假分類(lèi)毡咏。這種體系結(jié)構(gòu)是半監(jiān)督的,其中有標(biāo)簽和無(wú)標(biāo)簽的示例都用于模型訓(xùn)練逮刨。
III 模型解釋
圖-14對(duì)模型解釋進(jìn)行了分類(lèi):
從模型角度看呕缭,分為可對(duì)所有模型解析的方法和針對(duì)特定類(lèi)型模型解釋的方法。
從作用范圍看修己,分為局部解釋和整體解釋?zhuān)植糠椒ㄊ菍?duì)特定的預(yù)測(cè)進(jìn)行推理恢总,而全局方法探索整體模型行為。
第三種方法:用其它模型解決現(xiàn)有模型睬愤,包括兩種方法:一個(gè)是用簡(jiǎn)單的模型模擬復(fù)雜模型的行為片仿,另一種是用可視化的方法解析模型。
第四種方法:將醫(yī)學(xué)領(lǐng)域的模型解釋技術(shù)可以大致分為基于歸因的方法和基于非歸因的方法尤辱。
可視化激活映射
這可以揭示輸入的哪些區(qū)域/特征被高度激活砂豌,并將信息傳遞給分類(lèi)器厢岂。
Grad-Cam方法可以解析每個(gè)像素對(duì)決策的影響。(可以看看NLP有沒(méi)有類(lèi)似的方法)
用于各種模型的局部可解釋模型(LIME)
輸入被劃分為一系列可解釋的組件阳距,其中部分輸入被屏蔽塔粒。然后將每個(gè)擾動(dòng)樣本通過(guò)該模型得到特定類(lèi)的概率,并返回權(quán)重最高的分量作為解釋筐摘。
它的問(wèn)題是:由于解釋偏向于數(shù)據(jù)點(diǎn)卒茬,生成的解釋可能是不穩(wěn)定的,因此當(dāng)兩個(gè)分量接近時(shí)咖熟,可能導(dǎo)致非常不同的解釋圃酵。
SHapley加法解釋(SHAP)
目前存在,一個(gè)提供完整的解釋的方法馍管。
醫(yī)療異常檢測(cè)方法解釋
DeepLEFT辜昵、DeepTaylor、引導(dǎo)反向傳播(GBP)和集成梯度等也被用來(lái)解釋黑盒深度學(xué)習(xí)模型咽斧。
另外,可用注意力圖可以解釋模型特征的相互作用躬存,比如在醫(yī)療圖片和診斷信息之間建立聯(lián)系张惹;專(zhuān)家知識(shí)來(lái)解釋模型決策。
綜上岭洲,如何選擇模型解析器主要取決于以下因素:
- 使用全局解釋還是局部解釋
- 用戶(hù)對(duì)結(jié)果理解的專(zhuān)業(yè)水平
- 應(yīng)用領(lǐng)域是否有時(shí)間限制宛逗,解釋是否需要實(shí)時(shí)生成
IV 挑戰(zhàn)和開(kāi)放的研究問(wèn)題
A. 缺乏可解釋性
GradCAM, LIME, GBP這些方法都不是為醫(yī)學(xué)領(lǐng)域研發(fā)的,所以對(duì)臨床可能不是很有效盾剩,需要更多地加入專(zhuān)家共識(shí)雷激,比如Human-in-the-Loop技術(shù),用于設(shè)計(jì)可解釋的診斷模型告私,讓臨床專(zhuān)家可以改進(jìn)深度模型的決策屎暇,以模仿他們自己的決策過(guò)程。
另外驻粟,如果決策依賴(lài)于多個(gè)輸入特征流根悼,需要更復(fù)雜的策略來(lái)解釋行為。
強(qiáng)化學(xué)習(xí)蜀撑,也是一個(gè)方法挤巡,它通過(guò)試圖最大化獎(jiǎng)勵(lì),在迭代中改進(jìn)其檢測(cè)過(guò)程酷麦。代理用來(lái)探測(cè)異常的探測(cè)過(guò)程可以說(shuō)明其行為背后的直覺(jué)矿卑。
B. 因果關(guān)系和不確定性
因果和相關(guān)往往被混淆,XY同時(shí)發(fā)生沃饶,并一定存在因果關(guān)系母廷,只是相關(guān)轻黑,比如它們由于同樣原因引起。
普通模型只能找到關(guān)聯(lián)關(guān)系徘意,而無(wú)法找到其原因苔悦。如果想定位原因,還需要原因估計(jì)模型椎咧,比如:基于圖結(jié)構(gòu)玖详,基于算法信息理論的方法,因果貝葉斯網(wǎng)絡(luò)勤讽,但是這些方法很少在醫(yī)學(xué)異常檢測(cè)中應(yīng)用蟋座。
另外,數(shù)據(jù)中還存在不確定性脚牍,可能輸入小的改變就能影響模型預(yù)測(cè)的結(jié)果向臀,這與模型的置信度相關(guān)。
有一種方法诸狭,利用計(jì)算出的不確定性措施券膀,將困難的案例子集轉(zhuǎn)為進(jìn)一步檢查。(值得借鑒)
C. 缺乏通用性
模型可能缺乏對(duì)不同操作條件的概括驯遇,對(duì)于沒(méi)見(jiàn)過(guò)的數(shù)據(jù)集芹彬,可能效果不好。盡管公開(kāi)可用的數(shù)據(jù)集的數(shù)量持續(xù)增加叉庐,但可用的數(shù)據(jù)樣本數(shù)量仍然有限舒帮;另外,對(duì)數(shù)據(jù)的篩選陡叠,也可能讓模型不能捕捉真實(shí)數(shù)據(jù)分布玩郊。
圖-18展示了來(lái)自不同子集的樣本分布在嵌入空間中。
如果一個(gè)診斷模型只在這個(gè)數(shù)據(jù)集的一個(gè)特定子集上進(jìn)行訓(xùn)練枉阵,它就會(huì)在另一個(gè)子集上產(chǎn)生錯(cuò)誤檢測(cè)译红。因此,需要捕捉整個(gè)種群多樣性的大規(guī)模數(shù)據(jù)集岭妖。
醫(yī)學(xué)信息標(biāo)注成本高临庇,不太可能有像ImageNet那樣的豐富標(biāo)注的數(shù)據(jù)集。元學(xué)習(xí)可能起一定作用昵慌,它是遷移學(xué)習(xí)的一種假夺,它可對(duì)領(lǐng)域進(jìn)行適配,讓特定領(lǐng)域訓(xùn)練的模型可應(yīng)用到其它領(lǐng)域斋攀。
D. 處理數(shù)據(jù)不平衡和未標(biāo)記數(shù)據(jù)
數(shù)據(jù)不均衡會(huì)引起預(yù)測(cè)偏向主導(dǎo)類(lèi)別已卷,醫(yī)療異常檢測(cè)的不平衡一直是數(shù)據(jù)重采樣(過(guò)采樣或過(guò)采樣)和成本敏感訓(xùn)練,其中損失的權(quán)重分配給少數(shù)類(lèi)淳蔼。
另外侧蘸,還可以使用GAN做數(shù)據(jù)增強(qiáng)裁眯,合成較為真實(shí)的少數(shù)類(lèi)樣本。
對(duì)于大量無(wú)標(biāo)注的數(shù)據(jù)可以使用半監(jiān)督學(xué)習(xí)方法加以利用讳癌,上文中也示例了通過(guò)對(duì)無(wú)監(jiān)督算法的修改穿稳,將模型適用于正常的異常分類(lèi)任務(wù),而不是真假驗(yàn)證晌坤。
半監(jiān)督學(xué)習(xí)的目標(biāo)可被設(shè)計(jì)成自動(dòng)生成標(biāo)簽逢艘。然后,學(xué)習(xí)到的知識(shí)被轉(zhuǎn)移到不同的下游任務(wù)骤菠。
自監(jiān)督學(xué)習(xí)也可以應(yīng)用于檢測(cè)異常它改,但在醫(yī)學(xué)領(lǐng)域應(yīng)用比較少。
V 總結(jié)
略...