Nat mac int | 如何基于高維醫(yī)學(xué)影像構(gòu)建臨床可翻譯的 AI 系統(tǒng)
原創(chuàng)?風(fēng)不止步?圖靈基因?2021-12-04 07:03
收錄于話(huà)題#前沿生物大數(shù)據(jù)分析
撰文:風(fēng)不止步
IF=15.502
推薦度:?????
亮點(diǎn):
文章探討高維臨床成像數(shù)據(jù)所特有的挑戰(zhàn),強(qiáng)調(diào)開(kāi)發(fā)機(jī)器學(xué)習(xí)系統(tǒng)所涉及的一些技術(shù)和倫理考慮,這些系統(tǒng)代表許多成像模式的高維性質(zhì)榛瓮。此外撒踪,作者認(rèn)為試圖解決可解釋性寺董、不確定性和偏見(jiàn)的方法應(yīng)該被視為任何臨床機(jī)器學(xué)習(xí)系統(tǒng)的核心組成部分壁查。
2021年11月16日朴乖,美國(guó)William Hiesinger博士等人在《Nature machine intelligence》上發(fā)表了一篇“Designing clinically translatable artificial intelligence systems for high-dimensional medical imaging”的文章衩婚,概述了針對(duì)高維醫(yī)學(xué)成像機(jī)器學(xué)習(xí)的數(shù)據(jù)集管理細(xì)微差別和架構(gòu)注意事項(xiàng)窜护,并討論這些系統(tǒng)中的可解釋性、不確定性和偏差非春,為有興趣解決構(gòu)建臨床可翻譯?AI?系統(tǒng)所帶來(lái)的一些問(wèn)題和挑戰(zhàn)的研究人員提供模板柱徙。
在可預(yù)見(jiàn)的未來(lái),高質(zhì)量的“人工智能就緒”注釋醫(yī)療數(shù)據(jù)集的可用性將繼續(xù)落后于需求奇昙』の辏回顧分配臨床真實(shí)標(biāo)簽需要臨床專(zhuān)家投入大量時(shí)間,并且在聚合多機(jī)構(gòu)數(shù)據(jù)以供公開(kāi)發(fā)布方面存在巨大障礙储耐。除了以在硬放射學(xué)基本事實(shí)標(biāo)簽上訓(xùn)練的模型為特征的“診斷人工智能”之外羊初,還將需要對(duì)可能噪聲更大的臨床復(fù)合結(jié)果目標(biāo)進(jìn)行訓(xùn)練的“疾病預(yù)測(cè)人工智能”。使用標(biāo)準(zhǔn)化協(xié)議進(jìn)行圖像采集和臨床真實(shí)情況判定的前瞻性數(shù)據(jù)收集是構(gòu)建具有配對(duì)臨床結(jié)果的大規(guī)模多中心成像數(shù)據(jù)集的重要步驟什湘。
大型多中心成像數(shù)據(jù)集會(huì)產(chǎn)生大量與文件中嵌入的潛在敏感數(shù)據(jù)相關(guān)的隱私和責(zé)任問(wèn)題长赞。醫(yī)學(xué)數(shù)字成像和通信?(DICOM)?標(biāo)準(zhǔn)旨在為醫(yī)學(xué)圖像采集、存儲(chǔ)和提供工作流程管理闽撤,并且?guī)缀醣黄毡椴捎玫枚摺3上裎募袼財(cái)?shù)據(jù)和相關(guān)元數(shù)據(jù)。許多開(kāi)源和專(zhuān)有工具可以幫助對(duì)?DICOM?文件進(jìn)行去標(biāo)識(shí)化哟旗。后端醫(yī)院信息學(xué)框架還通過(guò)“安全列表”支持DICOM?去標(biāo)識(shí)化贩据,這是一種清除可能包含敏感信息的元數(shù)據(jù)字段的方法栋操。在面向用戶(hù)的方面,MIRC?臨床試驗(yàn)處理器匿名器是一種流行的替代方案饱亮,盡管它需要使用某些遺留軟件矾芙。文檔齊全的?Python?包也可用于在使用或傳輸?shù)胶献鳈C(jī)構(gòu)之前處理?DICOM?文件。然后可以提取成像數(shù)據(jù)并以各種機(jī)器可讀格式存儲(chǔ)近上。這些數(shù)據(jù)集很快就會(huì)變得龐大而笨拙蠕啄,雖然對(duì)數(shù)據(jù)存儲(chǔ)格式的細(xì)節(jié)的討論超出了本視角的范圍,但醫(yī)學(xué)成像?AI?的一個(gè)關(guān)鍵考慮因素是圖像分辨率的保留戈锻。
對(duì)于涉及?AI?系統(tǒng)與臨床醫(yī)生進(jìn)行頭對(duì)頭基準(zhǔn)測(cè)試的研究工作歼跟,或在臨床注釋者的幫助下管理大型數(shù)據(jù)集,我們建議以?DICOM?格式存儲(chǔ)掃描副本格遭。這允許通過(guò)可擴(kuò)展且易于使用的基于云的注釋工具進(jìn)行部署哈街,存在幾種用于分配掃描以供臨床專(zhuān)家評(píng)估的解決方案,要求的范圍可能從簡(jiǎn)單的掃描級(jí)別標(biāo)簽到詳細(xì)的特定于域的解剖分割掩碼拒迅。另一個(gè)優(yōu)點(diǎn)是掃描保持原始分辨率和質(zhì)量骚秦。實(shí)時(shí)協(xié)作模擬“基于團(tuán)隊(duì)”的臨床決策,注釋和標(biāo)簽可以輕松導(dǎo)出用于下游分析璧微。最重要的是作箍,其中許多工具都可以從任何現(xiàn)代?Web?瀏覽器遠(yuǎn)程訪問(wèn),并且非常易于使用前硫,極大改善用戶(hù)體驗(yàn)和減輕臨床合作者的技術(shù)負(fù)擔(dān)胞得。
聯(lián)合學(xué)習(xí)等更新的機(jī)器學(xué)習(xí)訓(xùn)練范式可能有助于規(guī)避與數(shù)據(jù)共享相關(guān)的許多障礙。盡管在醫(yī)學(xué)成像中已經(jīng)成功證明屹电,但在將這些方法用于常規(guī)臨床使用方面仍然存在大量技術(shù)挑戰(zhàn)阶剑。特別是在高維成像機(jī)器學(xué)習(xí)系統(tǒng)的背景下,由于需要從多個(gè)參與中心傳輸和更新訓(xùn)練的權(quán)重而引入的網(wǎng)絡(luò)延遲成為訓(xùn)練更大神經(jīng)網(wǎng)絡(luò)的基本速率限制步驟危号。研究人員還必須確保受訓(xùn)權(quán)重的傳輸在參與機(jī)構(gòu)之間是安全和加密的牧愁,這進(jìn)一步增加了網(wǎng)絡(luò)延遲。
現(xiàn)代臨床機(jī)器學(xué)習(xí)中使用的神經(jīng)網(wǎng)絡(luò)架構(gòu)主要源自那些針對(duì)大型照片或視頻識(shí)別任務(wù)進(jìn)行了優(yōu)化的架構(gòu)外莲。在?2018?年美國(guó)國(guó)立衛(wèi)生研究院路線(xiàn)圖中猪半,缺乏特定于醫(yī)學(xué)成像的架構(gòu)被認(rèn)為是一項(xiàng)關(guān)鍵挑戰(zhàn)。進(jìn)一步提出如何訓(xùn)練這些架構(gòu)在這些系統(tǒng)將如何轉(zhuǎn)化為現(xiàn)實(shí)世界方面發(fā)揮著重要作用偷线。下一代高維醫(yī)學(xué)成像?AI?將需要對(duì)更豐富磨确、上下文更有意義的目標(biāo)進(jìn)行訓(xùn)練,而不是簡(jiǎn)單的分類(lèi)標(biāo)簽淋昭。如今俐填,大多數(shù)醫(yī)學(xué)成像?AI?系統(tǒng)都專(zhuān)注于從正常背景診斷少數(shù)疾病安接。典型的方法是在訓(xùn)練這些算法時(shí)分配一個(gè)數(shù)字標(biāo)簽(疾蚕韬觥:1英融;正常:0)。這與臨床受訓(xùn)者學(xué)習(xí)通過(guò)成像掃描診斷不同疾病的方式大不相同歇式。
事件發(fā)生時(shí)間分析和不確定性量化隨著醫(yī)療人工智能系統(tǒng)從“診斷”應(yīng)用轉(zhuǎn)向更多“預(yù)后”應(yīng)用驶悟,事件發(fā)生時(shí)間預(yù)測(cè)(而不是簡(jiǎn)單的二元預(yù)測(cè))將在臨床環(huán)境中發(fā)現(xiàn)更多相關(guān)性。事件時(shí)間分析的特點(diǎn)是能夠預(yù)測(cè)作為時(shí)間函數(shù)的事件概率材失,而二元分類(lèi)器只能提供一個(gè)預(yù)定持續(xù)時(shí)間的預(yù)測(cè)痕鳍。與二元分類(lèi)器不同,事件時(shí)間分析考慮了數(shù)據(jù)的審查龙巨,以允許在觀察時(shí)間范圍內(nèi)失去跟進(jìn)或未經(jīng)歷感興趣事件的個(gè)人笼呆。生存分析在臨床研究中很常見(jiàn),并且是制定循證實(shí)踐指南的核心旨别。使用基于圖像和視頻的機(jī)器學(xué)習(xí)擴(kuò)展傳統(tǒng)的生存模型可以提供對(duì)組織切片或醫(yī)學(xué)成像掃描中特征的預(yù)后價(jià)值的有力洞察诗赌。用于時(shí)間事件分析的訓(xùn)練視覺(jué)網(wǎng)絡(luò)可能會(huì)用于篩查肺癌,有助于根據(jù)預(yù)期的侵襲性擴(kuò)散潛力進(jìn)行風(fēng)險(xiǎn)分層秸弛。
然而铭若,從可操作的角度來(lái)看,時(shí)間到事件的預(yù)測(cè)可能會(huì)被證明是有問(wèn)題的递览。在肺癌篩查的假設(shè)示例中叼屠,胸部計(jì)算機(jī)斷層掃描的可疑結(jié)節(jié)可能會(huì)預(yù)測(cè)有和沒(méi)有適當(dāng)治療干預(yù)的中位生存期。對(duì)于臨床醫(yī)生來(lái)說(shuō)绞铃,了解機(jī)器學(xué)習(xí)系統(tǒng)對(duì)個(gè)體患者的預(yù)測(cè)有多確定可能會(huì)很有趣镜雨。當(dāng)不確定一項(xiàng)任務(wù)時(shí),人類(lèi)往往會(huì)在謹(jǐn)慎方面犯錯(cuò)儿捧。機(jī)器學(xué)習(xí)系統(tǒng)輸出是0到1范圍內(nèi)的“類(lèi)別概率”或“正確的可能性”冷离。然而,當(dāng)今文獻(xiàn)中描述的大多數(shù)醫(yī)學(xué)成像機(jī)器學(xué)習(xí)系統(tǒng)都缺乏隱含的表達(dá)能力“我不知道”何時(shí)提供了超出模型分布的輸入數(shù)據(jù)纯命。即使輸入圖像是貓的圖像西剥,訓(xùn)練用于從計(jì)算機(jī)斷層掃描(例如)預(yù)測(cè)肺炎的分類(lèi)器在設(shè)計(jì)上也被強(qiáng)制提供輸出(肺炎或非肺炎)。當(dāng)人工智能系統(tǒng)部署在與人類(lèi)用戶(hù)一起工作的環(huán)境中時(shí)亿汞,不確定性量化的好處出現(xiàn)在項(xiàng)目的轉(zhuǎn)化階段的后期瞭空。許多不確定性量化方法的實(shí)現(xiàn)在許可許可下可用,并且與常用的機(jī)器學(xué)習(xí)框架兼容疗我。不確定性量化的結(jié)合可能有助于提高高風(fēng)險(xiǎn)醫(yī)學(xué)成像機(jī)器學(xué)習(xí)系統(tǒng)的可解釋性和可靠性咆畏,并減少自動(dòng)化偏差的可能性——臨床醫(yī)生可能過(guò)度依賴(lài)自動(dòng)化的一種現(xiàn)象。
了解這些機(jī)器學(xué)習(xí)系統(tǒng)如何得出他們的結(jié)論對(duì)于構(gòu)建這些系統(tǒng)的工程師和使用它們的臨床醫(yī)生來(lái)說(shuō)都具有相當(dāng)大的興趣吴裤。顯著圖和類(lèi)激活圖仍然是解釋機(jī)器學(xué)習(xí)算法如何進(jìn)行預(yù)測(cè)的事實(shí)上的標(biāo)準(zhǔn)旧找。在許多示例中,正確和錯(cuò)誤預(yù)測(cè)的顯著圖看起來(lái)幾乎相同麦牺。當(dāng)“疾病”狀態(tài)和“正常狀態(tài)”之間的差異需要注意圖像或視頻的同一區(qū)域時(shí)钮蛛,這些缺點(diǎn)更加明顯(圖?3)鞭缭。
臨床醫(yī)生應(yīng)注意,僅靠熱圖不足以解釋?AI?系統(tǒng)的運(yùn)作方式魏颓,在嘗試使用可視化(如上圖所示)識(shí)別故障模式時(shí)必須小心岭辣。更精細(xì)的方法可能涉及連續(xù)遮擋測(cè)試,其中在有意屏蔽臨床醫(yī)生用于進(jìn)行診斷或預(yù)測(cè)的區(qū)域之后評(píng)估圖像的性能甸饱。特別是在高維醫(yī)學(xué)成像研究的背景下沦童,激活圖可以為視頻類(lèi)成像研究的某些時(shí)間階段的相對(duì)重要性提供獨(dú)特的見(jiàn)解。
機(jī)器學(xué)習(xí)系統(tǒng)學(xué)習(xí)的功能可能取決于架構(gòu)設(shè)計(jì)選擇叹话。更重要的是偷遗,機(jī)器學(xué)習(xí)系統(tǒng)將根據(jù)提供給它的訓(xùn)練數(shù)據(jù)和目標(biāo)來(lái)學(xué)習(xí)和延續(xù)系統(tǒng)性的不平等。隨著醫(yī)療保健人工智能系統(tǒng)朝著未來(lái)疾病預(yù)測(cè)的方向發(fā)展驼壶,必須更加小心地考慮到這些群體在獲得醫(yī)療保健和結(jié)果方面的巨大差異鹦肿。除了在訓(xùn)練整個(gè)?AI?系統(tǒng)時(shí)結(jié)合結(jié)構(gòu)化數(shù)據(jù)的輸入之外,中間方法還涉及使用黑盒模型訓(xùn)練醫(yī)學(xué)成像神經(jīng)網(wǎng)絡(luò)辅柴。這可以通過(guò)構(gòu)建“融合網(wǎng)絡(luò)”來(lái)實(shí)現(xiàn)箩溃,其中表格數(shù)據(jù)被合并到基于圖像或視頻的神經(jīng)網(wǎng)絡(luò)中,或者其他具有相同基本目標(biāo)的更高級(jí)方法(生成組合的低維表示的自動(dòng)編碼器)數(shù)據(jù))碌嘀。即使沒(méi)有將人口統(tǒng)計(jì)輸入納入高維視覺(jué)網(wǎng)絡(luò)涣旨,研究小組通過(guò)比較不同性別、種族股冗、地域和收入群體的表現(xiàn)來(lái)審核他們的模型也很重要霹陡。機(jī)器學(xué)習(xí)系統(tǒng)可能會(huì)無(wú)意中學(xué)會(huì)進(jìn)一步延續(xù)和歧視少數(shù)民族和有色人種,因此在模型開(kāi)發(fā)過(guò)程的早期了解這種偏見(jiàn)至關(guān)重要止状。對(duì)機(jī)器學(xué)習(xí)系統(tǒng)的信任對(duì)于更廣泛的采用至關(guān)重要烹棉,因?yàn)橥ㄟ^(guò)顯著圖和估計(jì)特征重要性的模型不可知方法的組合來(lái)探索特定特征或變量如何以及為什么會(huì)導(dǎo)致預(yù)測(cè)。另一種方法是在訓(xùn)練邏輯中限制機(jī)器學(xué)習(xí)算法怯疤,確保優(yōu)化步驟發(fā)生以控制感興趣的人口統(tǒng)計(jì)變量浆洗。這類(lèi)似于多變量回歸模型,其中可以獨(dú)立于基線(xiàn)人口統(tǒng)計(jì)變量研究感興趣的風(fēng)險(xiǎn)因素的影響集峦。從技術(shù)角度來(lái)看伏社,這將涉及在訓(xùn)練循環(huán)中插入額外的懲罰損失,同時(shí)牢記模型性能略低的潛在權(quán)衡塔淤。有許多開(kāi)源工具包可以幫助研究人員確定不同變量和輸入流(圖像預(yù)測(cè)以及性別和種族等變量)的相對(duì)重要性摘昌。這些技術(shù)可能允許開(kāi)發(fā)更公平的機(jī)器學(xué)習(xí)系統(tǒng),甚至可以發(fā)現(xiàn)沒(méi)有預(yù)料到的隱藏偏見(jiàn)高蜂。
教授介紹
William Hiesinger聪黎,醫(yī)學(xué)博士
心胸外科助理教授(成人心臟外科)
Hiesinger?博士是董事會(huì)認(rèn)證的、受過(guò)獎(jiǎng)學(xué)金培訓(xùn)的成人心臟外科專(zhuān)家备恤。是斯坦福大學(xué)醫(yī)學(xué)院心胸外科的助理教授稿饰。其臨床重點(diǎn)包括全方位的心胸疾病和治療方法锦秒,例如心臟移植、肺移植湘纵、二尖瓣和主動(dòng)脈瓣修復(fù)脂崔、心肌病手術(shù)治療和冠狀動(dòng)脈搭橋手術(shù)滤淳。他擔(dān)任斯坦福機(jī)械循環(huán)支持計(jì)劃的外科主任梧喷,領(lǐng)導(dǎo)和指導(dǎo)心室輔助裝置?(VAD)?手術(shù)植入終末期心力衰竭患者。
美國(guó)國(guó)立衛(wèi)生研究院和胸外科基金會(huì)已撥款資助?Hiesinger?博士的研究脖咐。在斯坦福心胸治療和外科實(shí)驗(yàn)室铺敌,研究用于治療缺血性心力衰竭的生物工程設(shè)備、組織工程和血管生成細(xì)胞因子療法等創(chuàng)新屁擅。發(fā)表大量關(guān)于心室輔助裝置植入新技術(shù)偿凭、心力衰竭生命支持進(jìn)展、心力衰竭細(xì)胞移植以及許多其他主題的文章派歌。
目前研究:臨床試驗(yàn)Edwards PASCAL CLASP IID/IIF?關(guān)鍵臨床試驗(yàn)
參考文獻(xiàn)
Rohan Shad, John P. Cunningham et al.Designingclinically translatable artificial intelligence systems for high-dimensionalmedical imaging.(2021)