對(duì)話Gustavo Rohde教授——組織病理學(xué)AI診斷應(yīng)用專家
原創(chuàng)?圖靈基因?圖靈基因?2022-12-14 14:04?發(fā)表于江蘇
收錄于合集#前沿生物大數(shù)據(jù)分析
對(duì)話Gustavo Rohde——美國(guó)弗吉尼亞大學(xué)生物醫(yī)學(xué)工程和電子與計(jì)算機(jī)工程教授
Interview by Jonathon Tunstall
BIOSKETCH:Gustavo Rohde是美國(guó)弗吉尼亞大學(xué)生物醫(yī)學(xué)工程和電子與計(jì)算機(jī)工程教授,他負(fù)責(zé)圖像和數(shù)據(jù)科學(xué)實(shí)驗(yàn)室(imagedatascience.com)。他分別于1999年和2001年在Vanderbilt大學(xué)獲得物理學(xué)和數(shù)學(xué)學(xué)士學(xué)位以及工程學(xué)碩士學(xué)位膏潮。2005年獲美國(guó)馬里蘭大學(xué)應(yīng)用數(shù)學(xué)與科學(xué)計(jì)算博士學(xué)位。他在生物醫(yī)學(xué)成像祟同、信號(hào)和圖像分析、應(yīng)用數(shù)學(xué)理疙、計(jì)算生物學(xué)和機(jī)器學(xué)習(xí)等領(lǐng)域發(fā)表了超過(guò)100篇同行評(píng)審論文晕城。他曾擔(dān)任IEEE圖像處理學(xué)報(bào)、IEEE信號(hào)處理快報(bào)窖贤、IEEE生物醫(yī)學(xué)與健康信息學(xué)雜志砖顷、BMC生物信息學(xué)雜志和Cytometry A journals的編委會(huì)成員。他目前是美國(guó)國(guó)立衛(wèi)生研究院生物數(shù)據(jù)管理與分析(BDMA)研究組的正式成員赃梧。Rohde博士曾擔(dān)任2021年IEEE國(guó)際生物醫(yī)學(xué)圖像研討會(huì)(ISBI)的項(xiàng)目聯(lián)合主席滤蝠。
JT –Rohde教授,您是一名計(jì)算病理學(xué)家授嘀。您在職業(yè)生涯的哪個(gè)階段接觸到了數(shù)字病理學(xué)領(lǐng)域物咳?這是您偶然發(fā)現(xiàn)的,還是您早就對(duì)成像技術(shù)感興趣了蹄皱?
GR—大概在10到15年前览闰,當(dāng)我第一次以教授的身份加入學(xué)術(shù)界時(shí),很明顯數(shù)字病理學(xué)是一個(gè)新的領(lǐng)域夯接,它是通過(guò)引入硬件(如全切片成像)而出現(xiàn)的焕济。很明顯,這是一個(gè)不斷發(fā)展的領(lǐng)域盔几,像我們這樣的人有機(jī)會(huì)通過(guò)數(shù)學(xué)和建模在數(shù)字圖像分析技術(shù)的應(yīng)用上做出貢獻(xiàn)晴弃,特別是在癌癥領(lǐng)域。隨著全切片成像技術(shù)的引入逊拍,許多病理學(xué)部門意識(shí)到未來(lái)是數(shù)字化的上鞠。越來(lái)越多的病理學(xué)家愿意冒險(xiǎn),進(jìn)入這個(gè)世界芯丧,看看數(shù)字圖像分析能為他們的領(lǐng)域做出什么貢獻(xiàn)芍阎。我開(kāi)始思考“我們?nèi)绾螐乃麄兊慕嵌葋?lái)改善事情”,我接觸的人越多缨恒,就越清楚需要做出重要的貢獻(xiàn)谴咸。
JT –您是否偶然發(fā)現(xiàn)某個(gè)特定的掃描平臺(tái)或應(yīng)用程序激發(fā)了你的興趣?
GR–當(dāng)時(shí)骗露,我在匹茲堡岭佳,我們與匹茲堡醫(yī)學(xué)中心有合作。當(dāng)時(shí)萧锉,他們與通用電氣(GE)建立了合作關(guān)系珊随,成立了一家名為Omnyx的公司,但當(dāng)時(shí)已經(jīng)有了Aperio等其他公司的數(shù)字掃描儀。我們和病理科的幾個(gè)人有合作叶洞,我們一起寫(xiě)了幾篇論文鲫凶。
JT–所以你看到了這個(gè)新的數(shù)字成像領(lǐng)域和計(jì)算機(jī)分析方面的契合。最初在圖像分析或數(shù)據(jù)管理方面是否存在重疊衩辟?
GR–我在培訓(xùn)中的興趣是對(duì)圖像數(shù)據(jù)中描述的內(nèi)容進(jìn)行計(jì)算機(jī)建模和數(shù)學(xué)建拿牛。現(xiàn)在病理學(xué)的分辨率越來(lái)越高惭婿,可以看到單個(gè)細(xì)胞不恭,亞細(xì)胞結(jié)構(gòu)以及組織結(jié)構(gòu)。您可以兩全其美财饥,但也可以獲得大量數(shù)據(jù)换吧。我意識(shí)到,經(jīng)過(guò)15年甚至20年的進(jìn)步钥星,我們做出了很多貢獻(xiàn)沾瓦,其中很多都是我們所說(shuō)的工作流程改進(jìn)。例如谦炒,能夠以高分辨率數(shù)字化全切片贯莺,能夠以輕松的方式遠(yuǎn)程存儲(chǔ)和檢索。這些進(jìn)步促進(jìn)了病理學(xué)家工作流程的改進(jìn)宁改。如果他們想在家里看一些東西缕探,或者想從街對(duì)面或全國(guó)各地的同事那里獲得第二意見(jiàn),現(xiàn)在需要的時(shí)間都差不多还蹲。有很多這樣的改進(jìn)爹耗,我廣義地稱之為工作流程,但與此同時(shí)谜喊,我看著這個(gè)領(lǐng)域潭兽,會(huì)說(shuō),“我所在領(lǐng)域最大的問(wèn)題是什么斗遏?”這與我們?nèi)绾卧谟布截浴⒊上窦夹g(shù)、數(shù)據(jù)存儲(chǔ)诵次、數(shù)據(jù)傳輸账蓉、計(jì)算和數(shù)學(xué)建模方面利用這些貢獻(xiàn)有關(guān)。我們?cè)鯓硬拍馨堰@些事情放在一起來(lái)做以下兩件事逾一?
第一件事是改進(jìn)數(shù)字病理學(xué)背后的科學(xué)剔猿,建立對(duì)不同惡性腫瘤中細(xì)胞和組織組成的科學(xué)理解,無(wú)論它們是否是癌癥嬉荆。據(jù)我所知,病理學(xué)(請(qǐng)?jiān)试S我澄清一下酷含,我不是病理學(xué)家)受到病理學(xué)家日常使用的許多信息沒(méi)有以嚴(yán)格科學(xué)的方式收集的影響鄙早。這是一種格式塔方法汪茧,例如,有些病理學(xué)家喜歡在高倍鏡下操作限番,有些喜歡在低倍鏡下操作舱污,有些人更重視計(jì)數(shù)細(xì)胞,有些人則更重視其他方面弥虐。我并不是說(shuō)這是一門糟糕的科學(xué)扩灯,只是說(shuō),通過(guò)提供更可靠霜瘪、更可驗(yàn)證珠插、更定量的測(cè)量方法,可能會(huì)有機(jī)會(huì)改進(jìn)病理學(xué)背后的科學(xué)颖对。
第二件事是捻撑,我們?nèi)绾卫眠@些改進(jìn)的理解來(lái)做更好的診斷,給出更準(zhǔn)確的預(yù)后缤底,了解何時(shí)給予哪些患者何種治療顾患,從而從廣義上改善患者護(hù)理?
這兩件事結(jié)合在一起个唧,為像我這樣的人提供了一個(gè)為這個(gè)領(lǐng)域做出貢獻(xiàn)的機(jī)會(huì)江解。
JT -也許我們可以說(shuō),在病理學(xué)數(shù)字化的世界里徙歼,您的數(shù)學(xué)建模專業(yè)已經(jīng)成為該領(lǐng)域的主要分支犁河。也就是說(shuō),如果我們認(rèn)為病理學(xué)的核心組成部分是一張圖像鲁沥,我們對(duì)這張圖像進(jìn)行分析呼股,無(wú)論是用人腦尋找模式,還是用某種計(jì)算機(jī)算法做同樣的事情画恰。我們可以這樣認(rèn)為彭谁,病理學(xué)的最新進(jìn)展并不是由對(duì)生物學(xué)理解的增強(qiáng)所引領(lǐng)的,更多的是由一系列基于計(jì)算機(jī)的技術(shù)(如圖像處理允扇、數(shù)據(jù)管理缠局、網(wǎng)絡(luò)和圖像分析)的同時(shí)快速發(fā)展所導(dǎo)致的。
GR–這從來(lái)不是一個(gè)參數(shù)的問(wèn)題考润。數(shù)學(xué)建模是必需的狭园,但從了解生物學(xué)及生物物理學(xué),哪些分子糊治、哪些蛋白質(zhì)對(duì)成像和靶向很重要等方面出發(fā)唱矛,一系列其他參數(shù)也是必需的。我們需要知道這些因素在良性和惡性腫瘤之間的區(qū)別。這種理解必須是方程式的一部分绎谦,一旦你有了一些假設(shè)管闷、一些目標(biāo)、一些靶點(diǎn)窃肠,那么你就必須考慮什么是合適的實(shí)驗(yàn)室技術(shù)包个。一旦你知道你是想測(cè)量染色質(zhì)還是肌動(dòng)蛋白,微管蛋白冤留,微管還是線粒體碧囊。一旦你有了這種理解,那么下一個(gè)問(wèn)題是纤怒,什么是合適的實(shí)驗(yàn)室技術(shù)?我們用哪種染色劑??合適的制備方法是什么糯而?然后你再問(wèn)我們需要什么硬件??我們可以使用什么成像技術(shù)來(lái)獲取所需的信息??把所有這些放在一起,生物學(xué)肪跋,成像物理學(xué)歧蒋,以及對(duì)相關(guān)信息進(jìn)行數(shù)學(xué)建模的技術(shù)。把所有這些放在一起州既,我們可能會(huì)看到科學(xué)理解的真正進(jìn)步谜洽,轉(zhuǎn)化為患者護(hù)理的改進(jìn)。
JT–您認(rèn)為準(zhǔn)備工作的標(biāo)準(zhǔn)化是我們目前面臨的最大挑戰(zhàn)之一嗎吴叶?
GR–是的阐虚。當(dāng)然,我們已經(jīng)處理了來(lái)自不同中心的大量數(shù)據(jù)蚌卤。即使在同一個(gè)中心实束,你有時(shí)也會(huì)看到每個(gè)月的變化。也許是人員的變化逊彭,或者是基本的日常準(zhǔn)備方法的變化咸灿。即使是H&E染色有時(shí)也需要正常化侮叮,對(duì)于我這個(gè)領(lǐng)域的工作人員來(lái)說(shuō)避矢,這可能是一個(gè)核心問(wèn)題;如何規(guī)范多幅圖像的強(qiáng)度囊榜?這是圖像分析的核心問(wèn)題审胸。如果我們從基本原理上理解數(shù)據(jù)的來(lái)源卸勺,就可以用數(shù)字方式完成砂沛。這也可以通過(guò)進(jìn)一步標(biāo)準(zhǔn)化實(shí)驗(yàn)室技術(shù)來(lái)實(shí)現(xiàn),但我們要如何實(shí)現(xiàn)呢?我認(rèn)為基礎(chǔ)理解碍庵、基礎(chǔ)科學(xué)將為我們奠定基礎(chǔ)。我們需要確定我們需要收集的最重要、最合適的數(shù)據(jù)是什么富稻,如何測(cè)量這些數(shù)據(jù),以及如何以一種更容易校準(zhǔn)和標(biāo)準(zhǔn)化的系統(tǒng)方式進(jìn)行測(cè)量。
JT–您是否在工作中使用過(guò)任何商業(yè)軟件包或杠,或者您是否對(duì)這些軟件包進(jìn)行了評(píng)估哪怔,以了解它們?cè)谀承?biāo)準(zhǔn)下的表現(xiàn)?
GR -我們和匹茲堡的研究人員做了一項(xiàng)研究向抢,我們研究了一個(gè)癌癥分級(jí)軟件包认境,考察了該軟件包給出正確分級(jí)的能力。我們的問(wèn)題是挟鸠,我們的問(wèn)題是叉信,在基本成像參數(shù)方面,它的穩(wěn)定性和可靠性如何艘希?我們已經(jīng)知道硼身,在一些掃描儀器中,根據(jù)一天中不同的時(shí)間覆享,光照會(huì)有變化佳遂。例如,如果你在早晨掃描一張圖像撒顿,而機(jī)器處于某個(gè)溫度丑罪,并且有一段時(shí)間沒(méi)有使用,那么你會(huì)得到一定的照度和強(qiáng)度分布核蘸。然而巍糯,如果您在機(jī)器預(yù)熱并已使用數(shù)小時(shí)的當(dāng)天晚些時(shí)候掃描圖像,則會(huì)得到不同類型的強(qiáng)度分布客扎。這通常是肉眼幾乎察覺(jué)不到的祟峦,但我們?cè)噲D看看這個(gè)軟件包在圖像強(qiáng)度、亮度徙鱼、對(duì)比度等微小變化方面有多穩(wěn)定宅楞。結(jié)果并不樂(lè)觀针姿。相同制劑的分析存在很大差異。
JT—所以像溫度和環(huán)境光這樣的變量實(shí)際上會(huì)影響圖像分析包的輸出?
GR–可能是的厌衙,如果照明燈沒(méi)有完全校準(zhǔn)距淫,可能會(huì)產(chǎn)生影響。正如許多其他因素一樣婶希,如樣品制備慕匠、技術(shù)人員與其他人員的對(duì)比舞竿。其中幾個(gè)因素可能會(huì)導(dǎo)致組織制劑外觀的微小變化,事實(shí)證明,我們作為一個(gè)團(tuán)隊(duì)已經(jīng)使用了一段時(shí)間的許多算法玩荠,如果你仔細(xì)研究它們枚冗,會(huì)顯示出相關(guān)的巨大變化围俘。我認(rèn)為我們有大量工作要做羹呵,因?yàn)槲覀儽仨毚蠓纳七@種情況。
JT–是的瓷们,我明白了业栅,減少變量。我必須承認(rèn)谬晕,我以前從未考慮過(guò)圖像分析包的輸出可能會(huì)受到環(huán)境影響碘裕。
GR—我認(rèn)為從學(xué)術(shù)的角度來(lái)看,當(dāng)發(fā)表一篇論文時(shí)固蚤,越來(lái)越多的人會(huì)要求在發(fā)表之前進(jìn)行這種基本的理智檢查娘汞。
JT -我們現(xiàn)在也看到一些相當(dāng)優(yōu)秀的開(kāi)源圖像分析應(yīng)用程序正在出現(xiàn)。你會(huì)考慮在你的日常研究中使用這些軟件包嗎?
我知道其中一些夕玩,但由于我們是經(jīng)過(guò)培訓(xùn)的工程師你弦,我們都有自己喜歡的技術(shù)來(lái)分割細(xì)胞,從像素強(qiáng)度中提取數(shù)字特征燎孟,我們有自己的建模技術(shù)禽作。這是我們的工作,我們只使用我們最了解的東西揩页。有些人已經(jīng)在這個(gè)領(lǐng)域工作了20多年旷偿,所以在某些方面,我們還沒(méi)有看到更廣泛的開(kāi)源數(shù)字圖像病理學(xué)環(huán)境爆侣,這是令人驚訝的萍程。當(dāng)然,圖像分析領(lǐng)域一直不乏開(kāi)源編程環(huán)境兔仰,如Python茫负、Matlab等。然而乎赴,對(duì)于我們這樣的人忍法,工程師潮尝,數(shù)學(xué)家來(lái)說(shuō),所有這些開(kāi)源應(yīng)用程序都已經(jīng)存在了饿序,在GitHub或類似程序中找到一些等效的代碼下載并運(yùn)行通常只需要幾個(gè)小時(shí)或幾天的時(shí)間勉失。考慮到這一點(diǎn)原探,我認(rèn)為這些開(kāi)源軟件包在某種意義上已經(jīng)過(guò)時(shí)了乱凿,但我們都堅(jiān)持自己的方法。
JT—您是否有專門研究的特定腫瘤類型或組織類型咽弦,也許有靶向療法?
GR–是的告匠,事實(shí)上,我們每天都會(huì)問(wèn)的問(wèn)題是离唬,什么樣的貢獻(xiàn)是最基本的,你可以用它來(lái)做基礎(chǔ)科學(xué)划鸽,并能持續(xù)下去输莺?我們能做出什么貢獻(xiàn),而這些貢獻(xiàn)不會(huì)曇花一現(xiàn)裸诽,十年后仍然有用和相關(guān)嫂用?從這個(gè)角度來(lái)看,我們觀察細(xì)胞丈冬,想知道哪些信息可以很容易地提取出來(lái)嘱函?它對(duì)不同類型的癌癥有幫助嗎?之前有證據(jù)表明這是一條卓有成效的道路嗎埂蕊?出于這些原因往弓,我們決定專注于尋找從數(shù)字病理圖像中測(cè)量和量化核結(jié)構(gòu)信息的方法。我們寫(xiě)了一系列關(guān)于各種癌癥的論文蓄氧,包括黑素瘤函似,肺癌,甲狀腺癌喉童,肝癌撇寞,乳腺癌等。這是因?yàn)槎嗄陙?lái)堂氯,通過(guò)與真正的病理學(xué)家的合作蔑担,我們已經(jīng)意識(shí)到從組織圖像中提取的最確定的特征之一是細(xì)胞核,并且有許多染色質(zhì)咽白,它們是核結(jié)構(gòu)啤握、染色質(zhì)密度、核形態(tài)等特有的局扶,我們做了幾年的一個(gè)項(xiàng)目恨统,寫(xiě)了一系列的論文叁扫,就是:我們?nèi)绾握_地模擬細(xì)胞核內(nèi)染色質(zhì)分布的信息內(nèi)容,就像在這些不同類型的成像染色中描述的那樣畜埋?我們?cè)鯓硬拍芙⒄嬲哪P桶褋?lái)自不同掃描儀莫绣,不同中心,甚至不同癌癥類型的數(shù)據(jù)整合在一起呢悠鞍?我們可以問(wèn)這樣的問(wèn)題:A型惡性腫瘤的分布情況如何对室,它與B型癌癥有什么關(guān)系?我們知道咖祭,在這方面已經(jīng)做了很多工作掩宜,這些都不是新問(wèn)題,但在過(guò)去么翰,人們主要關(guān)注于測(cè)量某些獨(dú)立的屬性牺汤,這些屬性本身在物理上是非常穩(wěn)定的,但并沒(méi)有提供一個(gè)完整的視角來(lái)了解細(xì)胞核中發(fā)生了什么浩嫌。
JT -我的理解是檐迟,細(xì)胞核的大小和體積是區(qū)分癌細(xì)胞和非癌細(xì)胞的關(guān)鍵參數(shù)。我想你的意思是码耐,還有很多其他的核參數(shù)我們也應(yīng)該考慮進(jìn)去追迟?
GR–是的,但問(wèn)題是哪些參數(shù)以及如何組合它們骚腥?很久以前敦间,人們就意識(shí)到,在試圖區(qū)分一種癌癥的良性和惡性或侵襲性時(shí)束铭,像核面積這樣的單一參數(shù)可能只能提供少量的辨別能力廓块。然后人們意識(shí)到,如果你加入第二個(gè)參數(shù)契沫,比如核周長(zhǎng)剿骨,你就可以得到改進(jìn)。當(dāng)然埠褪,您可以添加其他參數(shù)以獲得進(jìn)一步的優(yōu)化浓利。在這一點(diǎn)上你必須思考,結(jié)合這些不同的參數(shù)意味著什么钞速,例如贷掖,面積以平方米為單位,周長(zhǎng)以米為單位渴语?如果你看看物理學(xué)的世界苹威,人們什么時(shí)候會(huì)這樣做?這有什么意義驾凶?我們需要回答這些基本問(wèn)題牙甫,然后使用這些知識(shí)來(lái)描述整個(gè)細(xì)胞核掷酗。這意味著不要只使用單一的特征,而是使用整個(gè)像素信息窟哺,這樣你就不會(huì)遺漏任何東西泻轰。你怎樣才能以一種自洽的方式吸收所有的特征信息,并使其具有物理意義且轨?我們?cè)鯓硬拍茏龅郊饶芎臀锢韺W(xué)家交談浮声,又能向病理學(xué)家解釋,同時(shí)又能捕捉到所有可以用于統(tǒng)計(jì)回歸的信息呢旋奢?
這就是我想說(shuō)的泳挥,找到基本的方法把它變成一門科學(xué)。如果我們能做出貢獻(xiàn)至朗,這還有待觀察屉符,但也許這將是一個(gè)有用的貢獻(xiàn)。核形態(tài)學(xué)在病理學(xué)中有著非常深厚的傳統(tǒng)锹引,我們認(rèn)為這將是一個(gè)很好的開(kāi)始目標(biāo)筑煮。一旦你弄明白了這些基本原理,你就可以運(yùn)用同樣的技術(shù)來(lái)問(wèn)線粒體與細(xì)胞的能量學(xué)有什么關(guān)系粤蝎?我們必須記住,當(dāng)涉及到圖像分析時(shí)袋马,我們是在處理大量信息初澎。即使從單個(gè)細(xì)胞核的圖像中,你也可以得到100×100像素分布虑凛。這是非常大的信息量碑宴,你必須弄清楚如何科學(xué)地對(duì)待它。
JT -我認(rèn)為生物系統(tǒng)是完全異質(zhì)的桑谍、不可預(yù)測(cè)的延柠,而你卻試圖將物理和數(shù)學(xué)等理性科學(xué)應(yīng)用于這些高度可變的生物系統(tǒng)。你如何以一種合乎邏輯的锣披、可驗(yàn)證的贞间、可重復(fù)的方式為生物異質(zhì)性建模?
GR -對(duì)雹仿,這是下一個(gè)層次的問(wèn)題增热。一旦你確定了要測(cè)量什么,以及如何以科學(xué)的方式測(cè)量這些參數(shù)胧辽,你還需要考慮如何正確地描述生物異質(zhì)性峻仇。如果你觀察一個(gè)腫瘤,你會(huì)看到數(shù)千甚至數(shù)百萬(wàn)個(gè)細(xì)胞邑商,尤其是全切片成像摄咆。從生物學(xué)上你也知道凡蚜,即使是在惡性組織中,也不是所有細(xì)胞都會(huì)表現(xiàn)出你所尋找的癌癥表型吭从。你知道背景中存在生物異質(zhì)性朝蜘,但你如何建立數(shù)學(xué)模型呢?這個(gè)問(wèn)題與統(tǒng)計(jì)領(lǐng)域也有重疊影锈,什么是適當(dāng)?shù)闹丿B呢芹务?該領(lǐng)域的適當(dāng)建模是什么?有很多基本的問(wèn)題要問(wèn)鸭廷,還有很多我們?nèi)匀粺o(wú)法回答枣抱。人們做了很多工作,他們應(yīng)用了很多技術(shù)辆床,但如果你問(wèn)不同的人佳晶,標(biāo)準(zhǔn)是什么?做這些事情的科學(xué)公認(rèn)的標(biāo)準(zhǔn)方法是什么讼载?你會(huì)得到太多不同的答案轿秧。這就是為什么我說(shuō)要建立學(xué)科的基礎(chǔ)。為了了解要采用哪種模型咨堤,我們需要問(wèn)菇篡,這個(gè)分子的亞細(xì)胞定位在良性和惡性之間有什么區(qū)別?不同類型細(xì)胞的組織結(jié)構(gòu)有什么不同一喘?如何測(cè)量它們驱还?哪些實(shí)驗(yàn)室技術(shù)可以標(biāo)準(zhǔn)化,如何用足夠高的分辨率測(cè)量這些技術(shù)凸克?如何提取正確的像素信息议蟆?如何對(duì)組織中的統(tǒng)計(jì)異質(zhì)性進(jìn)行建模?為了建立一個(gè)基礎(chǔ)萎战,建立一個(gè)普遍接受的方法來(lái)建立這個(gè)領(lǐng)域咐容,有很多問(wèn)題需要回答。
JT–您是否在使用機(jī)器學(xué)習(xí)原理來(lái)幫助改進(jìn)建模和更好地理解這個(gè)過(guò)程蚂维?
GR -部分是戳粒。這是一個(gè)艱難的領(lǐng)域,因?yàn)橛泻芏嗳嗽噲D用機(jī)器學(xué)習(xí)方法提供不同的進(jìn)步虫啥。而且享郊,在我看來(lái),這些機(jī)器學(xué)習(xí)方法往往會(huì)繞過(guò)我們一直在討論的科學(xué)基礎(chǔ)孝鹊。弄清楚該研究哪些分子炊琉,如何測(cè)量正確的東西,如何對(duì)待生物異質(zhì)性,如何用數(shù)學(xué)和統(tǒng)計(jì)方法對(duì)這些參數(shù)建模苔咪。就我個(gè)人而言锰悼,我認(rèn)為這是一種被誤導(dǎo)的方法。已經(jīng)做了很多工作团赏。很多人直接獲取像素強(qiáng)度箕般,并通過(guò)分類器或深度學(xué)習(xí)層次結(jié)構(gòu)或通過(guò)神經(jīng)網(wǎng)絡(luò)的進(jìn)化等將其與患者的輸出相關(guān)聯(lián)。在我看來(lái)舔清,這還有待觀察丝里,但我的預(yù)感是,對(duì)于一個(gè)關(guān)鍵系統(tǒng)(癌癥診斷是一個(gè)關(guān)鍵系統(tǒng)体谒,因?yàn)橹辽賹?duì)病人和親屬來(lái)說(shuō)杯聚,犯錯(cuò)誤是有一定代價(jià)的),對(duì)于這樣一個(gè)關(guān)鍵系統(tǒng)抒痒,我覺(jué)得盡管機(jī)器學(xué)習(xí)可能是解決方案的一部分幌绍,但它不是我們應(yīng)該專注于建立學(xué)科基礎(chǔ)的地方。
JT–所以故响,如果我們接受您的觀點(diǎn)傀广,即我們?nèi)栽谥贫ɑ疽?guī)則,并且在圖像分析和人工智能應(yīng)用于圖像分析方面還處于起步階段彩届;我想知道作為一名計(jì)算生物學(xué)家伪冰,您對(duì)未來(lái)的看法是什么?算法是否變得越來(lái)越復(fù)雜樟蠕,并最終將病理學(xué)家推向邊緣贮聂?一旦我們通過(guò)計(jì)算機(jī)科學(xué)馴服了生物異質(zhì)性,病理學(xué)家的未來(lái)角色將是什么樣子坯墨?他或她是否只限于簽署計(jì)算機(jī)生成的診斷?
GR -這還有待觀察病往。我認(rèn)為這樣的事情發(fā)生是有可能的捣染。也許在未來(lái),我們會(huì)有非常好的圖像分析算法停巷。這種情況有可能發(fā)生耍攘,我現(xiàn)在還不能排除這種可能性。問(wèn)題是我們能不能做到畔勤,如果能做到蕾各,怎么做?我的觀點(diǎn)是庆揪,如果我們要達(dá)到那個(gè)目標(biāo)式曲,或者至少有最好的機(jī)會(huì)達(dá)到那個(gè)目標(biāo),我們就必須解決基本問(wèn)題。所有這些問(wèn)題我們一直在討論吝羞。你測(cè)量的是什么兰伤?如何從像素?cái)?shù)據(jù)中測(cè)量它?你有合適的實(shí)驗(yàn)室技術(shù)和合適的成像方法嗎钧排?然后敦腔,在未來(lái),我們將看到對(duì)病理學(xué)家非常有用的數(shù)字輔助工具恨溜,他們將能夠單擊按鈕來(lái)實(shí)現(xiàn)準(zhǔn)確的診斷符衔。
你還說(shuō)圖像分析還處于初級(jí)階段,在這里你必須記住這不是一門新的科學(xué)糟袁。我們已經(jīng)投入了大量時(shí)間和投資判族。舉個(gè)例子,如果你看看神經(jīng)網(wǎng)絡(luò)系吭,在某些方面它們是50年前發(fā)明的五嫂。第一個(gè)試圖描述不同類型細(xì)胞之間差異的細(xì)胞成像技術(shù)可以追溯到20世紀(jì)50年代。當(dāng)時(shí)肯尺,由于缺乏成像能力和計(jì)算能力沃缘,他們受到了很大的阻礙,這是在過(guò)去二三十年中發(fā)生重大變化的一個(gè)方面则吟。因此槐臀,從我的角度來(lái)看,我們正處于解決這些問(wèn)題的初級(jí)階段氓仲,但我們已經(jīng)研究機(jī)器學(xué)習(xí)和圖像分析很長(zhǎng)時(shí)間了水慨。
JT -我的感覺(jué)是,建立解決生物異質(zhì)性的基礎(chǔ)也需要很長(zhǎng)時(shí)間敬扛。這是什么時(shí)候發(fā)生的晰洒?如果我們著眼于不久的將來(lái),比如20年后啥箭。那是什么樣子的谍珊?病理學(xué)家是否有一小批圖像分析工具來(lái)輔助篩選過(guò)程,或者我們是否可以考慮全自動(dòng)分析急侥?
GR–好吧砌滞,讓我們來(lái)看看過(guò)去20年人們一直在努力做什么。例如坏怪,有些公司一直在嘗試自動(dòng)化宮頸篩查贝润。這對(duì)許多技術(shù)人員和病理學(xué)家來(lái)說(shuō)是一項(xiàng)繁重的工作量。一些公司已經(jīng)嘗試制作專門用于細(xì)胞學(xué)的系統(tǒng)來(lái)緩解和改善這種情況铝宵,他們已經(jīng)建立了自動(dòng)處理圖像的系統(tǒng)打掘。他們觀察特定的細(xì)胞,試圖提取細(xì)胞核和細(xì)胞質(zhì)的信息,并測(cè)量細(xì)胞核與細(xì)胞質(zhì)的比率胧卤。然后他們得出一些基本的統(tǒng)計(jì)數(shù)據(jù)唯绍。重點(diǎn)是去除枯燥乏味的任務(wù),以便病理學(xué)家能夠更有效地利用自己的時(shí)間枝誊。他們成功了嗎况芒?是的,也不是叶撒。當(dāng)然绝骚,病理學(xué)家正在購(gòu)買這些系統(tǒng),他們正在提高生產(chǎn)力祠够。是2倍還是3倍压汪?這取決于你和誰(shuí)交談,而結(jié)果實(shí)際上是相當(dāng)復(fù)雜的古瓤。
所以止剖,在未來(lái),這是一個(gè)艱難的抉擇落君。我們能否建立一個(gè)系統(tǒng)穿香,將這種生產(chǎn)力,也就是數(shù)字圖像分析的成功率提高到一個(gè)更高的水平绎速?我認(rèn)為這是可能的皮获,你永遠(yuǎn)不能低估人類在面臨關(guān)鍵需求時(shí)的創(chuàng)造力。我們已經(jīng)學(xué)會(huì)了如何改造基因纹冤,很少會(huì)讓情況變得更糟洒宝。所以,年復(fù)一年萌京,我們至少在逐步改善雁歌。問(wèn)題是,我們是否會(huì)看到生產(chǎn)力的巨大提高知残。我相信我們可以靠瞎,但我認(rèn)為如果我們可以,它可能來(lái)自于我們把基本概念組合起來(lái)橡庞,然后在這些概念的基礎(chǔ)上進(jìn)行建設(shè)较坛。從某種程度上說(shuō)印蔗,我們嘗試抄近路扒最,直接從圖像出發(fā),去掉基本原理华嘹,直接使用預(yù)測(cè)模型吧趣,我認(rèn)為你會(huì)看到很多曇花一現(xiàn)的東西。五到十年后,我們甚至可能會(huì)討論一種不同的方法强挫,這會(huì)使我們無(wú)法在彼此的工作基礎(chǔ)上再接再厲岔霸。因此,你提出的問(wèn)題很難回答俯渤,我無(wú)法做出預(yù)測(cè)呆细。
JT–所以您建議我們應(yīng)該回到基礎(chǔ),例如八匠,使樣品制備標(biāo)準(zhǔn)化絮爷。然后我們聚在一起,大家都同意這是一個(gè)標(biāo)準(zhǔn)的制備梨树,這是我們實(shí)現(xiàn)標(biāo)準(zhǔn)制備的方法坑夯。當(dāng)然,這可能需要使用高度標(biāo)準(zhǔn)化的自動(dòng)染色系統(tǒng)抡四,該系統(tǒng)本身由計(jì)算機(jī)控制柜蜈,不會(huì)對(duì)生物異質(zhì)性的每一個(gè)可能的細(xì)微差別進(jìn)行驗(yàn)證,但至少它產(chǎn)生了一個(gè)輸入標(biāo)準(zhǔn)指巡。然而淑履,即使在這種情況下,您認(rèn)為我們需要處理較低級(jí)別的可變性厌处,來(lái)開(kāi)發(fā)真正的自動(dòng)化分析嗎鳖谈?
GR–是的,基礎(chǔ)生物學(xué)阔涉。問(wèn)題是:什么是不同的缆娃,什么是實(shí)際的圖像?什么是更容易成像的實(shí)用生物標(biāo)志物瑰排?如果你有了這些贯要,那么現(xiàn)在你就有了一個(gè)標(biāo)準(zhǔn)化的實(shí)驗(yàn)室流程,很容易復(fù)制椭住。你如何以標(biāo)準(zhǔn)化的方式成像崇渗?哪種圖像分析算法足夠穩(wěn)健京郑?如何提取正確的特征宅广?如何對(duì)生物異質(zhì)性進(jìn)行數(shù)學(xué)建模?什么是正確的統(tǒng)計(jì)數(shù)據(jù)些举?我認(rèn)為跟狱,所有這些因素加在一起,將是我們達(dá)到目標(biāo)的必要條件户魏。
你也可以從包括放射學(xué)在內(nèi)的其他學(xué)科中找到相似之處驶臊∨布罚基本的投影放射學(xué)已經(jīng)存在很長(zhǎng)時(shí)間了,但計(jì)算機(jī)斷層掃描关翎、核磁共振成像等技術(shù)從一開(kāi)始就數(shù)字化了扛门。自20世紀(jì)80年代初以來(lái),人們一直在追求基本病癥纵寝、疾病论寨、創(chuàng)傷等的自動(dòng)化診斷,但即使是現(xiàn)在爽茴,如果你問(wèn)這些自動(dòng)化技術(shù)在多大程度上真正能夠表明此人患有某種類型的惡性腫瘤政基,你也會(huì)得到好壞參半的答案。因此闹啦,有懷疑的空間沮明,也有樂(lè)觀的空間。有時(shí)我看到自己站在中間窍奋。數(shù)字病理學(xué)也可能走上同樣的道路荐健,20年后,我們也有了類似的對(duì)話琳袄。這很可能就是未來(lái)江场,但樂(lè)觀地看,即使這真的發(fā)生了窖逗,也肯定會(huì)在工作流程址否、通信、存儲(chǔ)等方面有改進(jìn)碎紊。我們將看到進(jìn)步佑附。有時(shí)候只是很難預(yù)測(cè)它們會(huì)在哪里。
JT-您使用了“曇花一現(xiàn)”這個(gè)詞仗考,我想澄清一下音同,你是指非常明確的環(huán)境下的特定點(diǎn)解決方案嗎?
GR–或者那些在當(dāng)時(shí)看起來(lái)像是解決方案的東西秃嗜,但經(jīng)過(guò)幾年的進(jìn)一步研究权均,我們發(fā)現(xiàn)了根本性的缺陷,人們就放棄了那個(gè)特定的解決方案锅锨。這是曇花一現(xiàn)更深遠(yuǎn)的后果叽赊。我并不是說(shuō)這一定會(huì)發(fā)生,但這肯定是有可能的必搞。
JT -我對(duì)通過(guò)計(jì)算機(jī)系統(tǒng)進(jìn)行大規(guī)模篩查的可能性非常感興趣必指,因?yàn)槟壳帮@然缺乏病理學(xué)家。病理學(xué)家越來(lái)越老顾画,年輕人也不愿意進(jìn)入這一科學(xué)領(lǐng)域取劫。如果你想到一門學(xué)科,比如前列腺分析研侣,那么一種預(yù)篩查算法(當(dāng)然要注意必須處理假陰性)將非常有價(jià)值谱邪,不是嗎?
GR–是的庶诡,當(dāng)然惦银,還有圖像分析的另一個(gè)方面,我們有時(shí)忽略了討論末誓。我們分析的輔助工具不僅有助于分析本身扯俱,而且有助于教學(xué)。這是一種檢索相似圖像和相似病例的能力喇澡,把一堆數(shù)據(jù)放在一群病理學(xué)實(shí)習(xí)生面前迅栅。的確,已經(jīng)出現(xiàn)了一些重大的創(chuàng)新晴玖,它們將帶來(lái)改變读存。圖像分析在檢索正確的圖像和可比較的數(shù)據(jù)集以及進(jìn)行安全可靠的計(jì)算方面可以發(fā)揮重要作用。這些類型的應(yīng)用程序已經(jīng)存在呕屎。毫無(wú)疑問(wèn)让簿,令人興奮的事情將在未來(lái)發(fā)生,但很難預(yù)測(cè)哪些事情會(huì)真正有用秀睛,并且會(huì)長(zhǎng)壽尔当。在我們這個(gè)領(lǐng)域的人,機(jī)器學(xué)習(xí)者蹂安,他們也將提出持續(xù)不斷的創(chuàng)新椭迎。有些將是曇花一現(xiàn),有些將持續(xù)下去田盈,在未來(lái)無(wú)處不在侠碧。然而,如果你問(wèn)我缠黍,那些基于首先發(fā)現(xiàn)基礎(chǔ)知識(shí)弄兜,然后利用這些知識(shí)來(lái)組合算法的解決方案是會(huì)成功的,這也是我傾向于重點(diǎn)關(guān)注的地方瓷式。
JT–然后FDA會(huì)說(shuō)NO替饿!監(jiān)管,這是終極障礙贸典,不是嗎视卢?你不認(rèn)為所有這些解決方案面臨的最困難的長(zhǎng)期挑戰(zhàn)是獲得和保持監(jiān)管機(jī)構(gòu)的批準(zhǔn)嗎?
GR -這是關(guān)注基本面的另一個(gè)原因廊驼。如果你不僅能說(shuō)明一個(gè)解決方案何時(shí)有效据过,而且能說(shuō)明它何時(shí)失效惋砂。如果你能解釋失敗的時(shí)間和原因。如果你有所有這些理解绳锅,那么你就可以教會(huì)人們何時(shí)使用它西饵,何時(shí)信任它,何時(shí)不信任它鳞芙。如果這些答案與解決方案一起出現(xiàn)眷柔,那么我懷疑這將為通過(guò)監(jiān)管機(jī)構(gòu)的審批創(chuàng)造一條更容易的途徑。
JT -Rohde教授原朝,我們就講到這里驯嘱。感謝您今天抽出時(shí)間。