Nat Med | 癌癥組織病理學(xué)中分散式人工智能的群體學(xué)習(xí)
原創(chuàng)?圖靈基因?圖靈基因?2022-06-02 07:03?發(fā)表于江蘇
收錄于合集#前沿生物大數(shù)據(jù)分析
包括利茲大學(xué)醫(yī)學(xué)科學(xué)家在內(nèi)的一個國際研究團隊表示洒擦,他們已經(jīng)開發(fā)出一種新方法,利用人工智能從患者數(shù)據(jù)中預(yù)測癌癥,而不會將個人信息置于風(fēng)險之中。科學(xué)家們在《Nature Medicine》上發(fā)表了他們的研究成果(“Swarm learning for decentralized artificial intelligence in cancer histopathology”)甚颂。
“人工智能(AI)可以直接從常規(guī)組織病理切片預(yù)測分子改變的存在。然而,訓(xùn)練強大的AI系統(tǒng)需要大型數(shù)據(jù)集合住,數(shù)據(jù)收集面臨著現(xiàn)實、道德和法律方面的障礙撒璧。這些障礙可以通過群體學(xué)習(xí)(SL)來克服透葛。合作伙伴可以共同訓(xùn)練人工智能模型,同時避免數(shù)據(jù)傳輸和壟斷數(shù)據(jù)治理卿樱×藕Γ”研究人員寫道。
“在這里繁调,我們展示了SL在來自5000多名患者的千兆像素組織病理學(xué)圖像的大型多中心數(shù)據(jù)集中的成功應(yīng)用萨蚕。我們表明,使用SL訓(xùn)練的AI模型可以直接從蘇木精和伊紅(H&E)?染色的結(jié)直腸癌病理切片預(yù)測BRAF突變狀態(tài)和序列不穩(wěn)定性蹄胰。我們在來自北愛爾蘭岳遥、德國和美國的三個患者隊列上訓(xùn)練了AI模型,并在來自英國的兩個獨立數(shù)據(jù)集中驗證了預(yù)測性能裕寨『迫兀”
“我們的數(shù)據(jù)顯示,經(jīng)過SL訓(xùn)練的AI模型優(yōu)于大多數(shù)局部訓(xùn)練的模型宾袜,并且性能與在合并數(shù)據(jù)集上訓(xùn)練的模型相當(dāng)捻艳。此外,我們還表明庆猫,基于SL的AI模型數(shù)據(jù)效率較高认轨。未來,SL可用于為任何組織病理學(xué)圖像分析任務(wù)訓(xùn)練分布式AI模型月培,無需數(shù)據(jù)傳輸嘁字。”
研究人員開始探索一種稱為群體學(xué)習(xí)的人工智能是否可以在不從醫(yī)院發(fā)布數(shù)據(jù)的情況下杉畜,幫助計算機在患者組織樣本的醫(yī)學(xué)圖像中預(yù)測癌癥纪蜒。群體學(xué)習(xí)訓(xùn)練人工智能算法來檢測當(dāng)?shù)蒯t(yī)院或大學(xué)的數(shù)據(jù)模式,例如人體組織圖像中的基因變化寻行。
然后霍掺,swarm學(xué)習(xí)系統(tǒng)將這種新訓(xùn)練的算法(但沒有本地數(shù)據(jù)或患者信息)發(fā)送到中央計算機。在那里,它以相同的方式與其他醫(yī)院生成的算法相結(jié)合杆烁,以創(chuàng)建一個優(yōu)化的算法牙丽。然后將其發(fā)送回當(dāng)?shù)蒯t(yī)院,在那里將其重新應(yīng)用于原始數(shù)據(jù)兔魂,由于其更靈敏的檢測能力烤芦,改進了對基因變化的檢測。
通過多次執(zhí)行此操作析校,可以改進算法构罗,并創(chuàng)建一個適用于所有數(shù)據(jù)集的算法。這意味著該技術(shù)可以應(yīng)用智玻,而無需向第三方公司發(fā)布任何數(shù)據(jù)遂唧,也無需在醫(yī)院之間或跨境發(fā)送任何數(shù)據(jù)。
該團隊根據(jù)來自北愛爾蘭吊奢、德國和美國的三組患者的研究數(shù)據(jù)對AI算法進行了訓(xùn)練盖彭。這些算法在利茲大學(xué)生成的兩組大型數(shù)據(jù)圖像上進行了測試,發(fā)現(xiàn)它們成功地學(xué)會了如何預(yù)測圖像中不同癌癥亞型的存在页滚。
“基于來自5000多名患者的數(shù)據(jù)召边,我們能夠證明,經(jīng)過群體學(xué)習(xí)訓(xùn)練的AI模型可以直接從結(jié)腸腫瘤組織的圖像中預(yù)測與臨床相關(guān)的基因變化裹驰∷砦酰”利茲大學(xué)醫(yī)學(xué)院客座副教授、亞琛工業(yè)大學(xué)附屬醫(yī)院研究員Jakob Nikolas Kather說幻林。
利茲大學(xué)醫(yī)學(xué)院病理學(xué)教授Phil Quirke博士補充說:“我們已經(jīng)證明贞盯,群體學(xué)習(xí)可以用于醫(yī)學(xué),為任何圖像分析任務(wù)訓(xùn)練獨立的AI算法滋将。這意味著有可能克服數(shù)據(jù)傳輸?shù)男枰谛鵁o需機構(gòu)放棄對其數(shù)據(jù)的安全控制症昏。創(chuàng)建一個能夠執(zhí)行此任務(wù)的人工智能系統(tǒng)可以提高我們在未來應(yīng)用人工智能的能力随闽。”