姓名:張萌? ? ? ? ? 學(xué)號(hào)17021211113
轉(zhuǎn)載自:http://mp.weixin.qq.com/s/mkYVhiwQJwcXxUdBVUvU8w
【嵌牛導(dǎo)讀】:醫(yī)療影像是什么,醫(yī)療影像處理在做什么快鱼,醫(yī)療影像技術(shù)要往哪里去颠印。
【嵌牛鼻子】:醫(yī)療影像
【嵌牛提問】:醫(yī)療影像發(fā)展前景如何?
【嵌牛正文】:醫(yī)療抹竹,是「死生亦大矣」層面的討論线罕。這個(gè)鮮少「跟風(fēng)」、轉(zhuǎn)變審慎到近乎遲滯的行業(yè)窃判,領(lǐng)域內(nèi)研究通常要落后工程技術(shù)業(yè)界五年钞楼。
而這一次深度學(xué)習(xí)的高熱從自然影像蔓延到醫(yī)療影像,只用了不到兩年袄琳。就算數(shù)據(jù)維度不一樣询件、工具不能套用燃乍,研究者們還是義無反顧地跳了這個(gè)坑。這等擴(kuò)散能力雳殊,可以說是堪比癌細(xì)胞了橘沥。
如今,深度學(xué)習(xí)跨領(lǐng)域的霸權(quán)地位夯秃,讓跨領(lǐng)域的技術(shù)探討變得容易——如今三百六十行里座咆,誰也離不開「分層、激活仓洼、反向傳播」三板斧介陶。八竿子打不著的兩個(gè)領(lǐng)域里,討論起彼此的神經(jīng)網(wǎng)絡(luò)也是津津有味色建。然而醫(yī)療影像圈卻總是顯得格外神秘:當(dāng)我們談起醫(yī)療影像哺呜,除了知道研究對(duì)象是五臟廟,最終目的是節(jié)約醫(yī)療資源之外箕戳,仿佛不再有其他談資某残。
醫(yī)療影像是什么,醫(yī)療影像處理在做什么陵吸,醫(yī)療影像技術(shù)要往哪里去玻墅。這一回,我們和體素科技創(chuàng)始人壮虫、第一批代表醫(yī)療影像界吃深度學(xué)習(xí)這口螃蟹的研究者澳厢,丁曉偉博士從技術(shù)層面聊了聊這「哲學(xué)三問」。
醫(yī)療影像和自然影像有什么不一樣
醫(yī)療影像的特點(diǎn)囚似,一言以蔽之剩拢,就是「特別大,同時(shí)特別小」饶唤。
「大」體現(xiàn)在維數(shù)上徐伐,也體現(xiàn)在空間分辨率和色彩分辨率上。
無論是人手一部的智能手機(jī)還是專業(yè)的單反相機(jī)搬素,日常生活里的影像都天然是二維的呵晨,即使是深度攝像機(jī),也只能捕捉到「2.5 維」的信息:鏡頭與障礙物之間的直線距離變成了已知熬尺,然而中間空氣的內(nèi)容仍然是未知。而許多醫(yī)療影像谓罗,如 CT(電腦斷層掃描)與 MRI(核磁共振成像)粱哼,則是天然三維的,一個(gè)更學(xué)術(shù)的說法檩咱,就是三維坐標(biāo)系里每一個(gè)點(diǎn)都有對(duì)應(yīng)的像素值揭措。
在分辨率上胯舷,自然影像界標(biāo)桿一樣的數(shù)據(jù)集 ImageNet,平均圖像大小在 469*387绊含,一般的視覺模型會(huì)把圖像處理成 256*256 后進(jìn)行操作桑嘶。而一張普通的 2D X 光片的分辨率在 3000*3000 左右,一組 3D 的 CT 影像維度則在 500*500*500 左右躬充。
同時(shí)逃顶,一張 8 位色的自然圖像有 256 階,而一張 CT 影像則有上萬階充甚。這還只是「普通」的醫(yī)療影像以政,至于動(dòng)輒 50G 一張的病理圖片,在醫(yī)療影像界也是屢見不鮮伴找。
有人會(huì)說盈蛮,圖像大有什么要緊,壓縮不就行了技矮?然而自 1895 年倫琴發(fā)現(xiàn) X 光以來抖誉,無數(shù)醫(yī)學(xué)影像學(xué)的工程師與醫(yī)生窮極職業(yè)生涯之力,只為用有限的輻射劑量提供盡可能清晰的影像衰倦,力求輔助醫(yī)生進(jìn)行更為精確的診斷袒炉。每個(gè)像素的信息都得來不易,又豈能輕易放棄耿币。
所以梳杏,醫(yī)療影像模型,還沒開始就注定比其他視覺模型難上一個(gè)數(shù)量級(jí)淹接。
既然醫(yī)療影像天生就是 3D 影像十性,所以使用 3D 模型而不是 2D 模型解決問題,聽起來似乎是一個(gè)理所當(dāng)然的選項(xiàng)塑悼?
其實(shí)不盡然劲适。以丁曉偉為代表的第一批將深度學(xué)習(xí)引入醫(yī)療影像的研究者從 2013 年開始做 3D 深度學(xué)習(xí)模型,但是直到今天厢蒜,在解決 3D 醫(yī)療影像問題上霞势,「2D 和 3D 模型各有優(yōu)劣,哪種更有效仍然沒有定論」斑鸦。
3D 模型的優(yōu)點(diǎn)和缺點(diǎn)一樣明顯愕贡。醫(yī)療影像問題本身無疑是 3D 問題,病人是 3D 的病人巷屿,病灶是 3D 的病灶固以,2D 截面是會(huì)破壞其空間延續(xù)性、損失 3D 空間信息量的。一個(gè)腫瘤的截面和一個(gè)一個(gè)血管的橫截面憨琳,在像素和特征角度都沒有任何區(qū)別诫钓,理論上無法區(qū)分開,可只要你上下看一看篙螟,蜿蜒的血管和球狀的腫瘤就一目了然了菌湃。然而,3D 模型也沒有成熟的遍略、經(jīng)過驗(yàn)證的結(jié)構(gòu)惧所。選擇了 3D 模型就選擇了在知識(shí)的荒野里開疆辟土,沒有先人證明可行的結(jié)構(gòu)墅冷,更不用說經(jīng)過預(yù)訓(xùn)練的參數(shù)設(shè)置纯路,一切都要從頭做起。
而且 3D 模型本身也是一個(gè)龐然大物寞忿。卷積神經(jīng)網(wǎng)絡(luò)(CNN)的高效之處在于它利用了小的卷積核(kernel)來大幅減少需要優(yōu)化的參數(shù)的數(shù)量驰唬,例如一個(gè) 4*4 大小的卷積核只需要對(duì) 16 個(gè)參數(shù)進(jìn)行優(yōu)化。但是 3D 模型一下子就把需要優(yōu)化的參數(shù)數(shù)量做了指數(shù)升級(jí)腔彰,一個(gè) 4*4*4 的卷積核就有 64 個(gè)需要優(yōu)化的參數(shù)叫编,隨之而來的是過擬合(overfitting)風(fēng)險(xiǎn)的急劇升高,難易訓(xùn)練出泛化(generalization)效果良好的模型霹抛。
因此也有研究者試圖另辟蹊徑搓逾,在 2D 空間里找一些技巧來引入 3D 信息:比如把 5 張橫截面影像疊在一起,以一個(gè)堆(stack)的形式作為模型的輸入杯拐。而 3D 模型的研究者也想盡辦法把圖像做聰明的切割和重組霞篡。
迄今為止,兩種思路打了個(gè)平手端逼。誰也沒有明顯的優(yōu)勢朗兵。
但是體素仍然選擇了 3D 模型《ヌ玻「也是一個(gè)風(fēng)險(xiǎn)很大的探索過程吧余掖。我的個(gè)人風(fēng)格是不太喜歡從工程角度取巧,問題是什么樣礁鲁,模型就應(yīng)該是什么樣盐欺。」而面對(duì) 3D 模型沒有通用數(shù)據(jù)集仅醇、沒有預(yù)訓(xùn)練模型的弱點(diǎn)冗美,體素的答案也很簡單:自己做∥龆「我們想做醫(yī)療影像界的 ImageNet墩衙。」甲抖,丁曉偉說漆改,「我們想把人的各種結(jié)構(gòu)、各類常見病種病理全部交給一個(gè)統(tǒng)一模型(unified model)准谚,讓模型首先對(duì)影像里『有什么』有一個(gè)概念挫剑,然后再針對(duì)具體的應(yīng)用開發(fā)精校的模型≈危」
「小」體現(xiàn)在關(guān)注區(qū)域上樊破。
自然圖像處理問題大多關(guān)心的是在圖像中貢獻(xiàn)主要語義的主要物體,如人唆铐,人臉哲戚,車輛,車牌艾岂,道路顺少,目標(biāo)面積占畫幅比例較大,大的超過 30%王浴,小的也應(yīng)有 2%脆炎。這些目標(biāo)有較為充足的細(xì)節(jié)和信息量供深度學(xué)習(xí)按層級(jí)抽取特征。
而在醫(yī)學(xué)影像中則不同氓辣,圖像中的主要物體是正常的人體結(jié)構(gòu)秒裕,而這并不是關(guān)注的重點(diǎn),很多場景關(guān)心的目標(biāo)是早期的微小病灶钞啸。假設(shè)有一個(gè) 3mm 的近似球形的腫瘤需要在薄層 CT 中檢出几蜻,那么這個(gè)目標(biāo)物體在整個(gè) 500*500*500 分辨率的 3D 畫幅中只占有不到 25 個(gè)體積像素(體素),那么這個(gè)物體占畫幅比例是不超過 0.0125% 的体斩。并且在一個(gè)平面上不足 10 像素的物體上梭稚,也是不足以抽取具有層級(jí)關(guān)系的圖像特征的,從而模型縱然有很強(qiáng)的表達(dá)能力硕勿,也無用武之地哨毁。
拿到醫(yī)療影像之后,計(jì)算機(jī)能夠做什么
一個(gè)比較清晰的分類角度源武,是先按處理的序列數(shù)劃分扼褪,再按處理的層級(jí)劃分。
首先粱栖,所有的影像都可以在一個(gè)序列上進(jìn)行處理话浇,常見的有檢測(detection,用邊界框的形式確定物體的位置在哪里)闹究,分割(segmentation幔崖,找到邊緣,能夠量化大小等對(duì)特征提取比較有利的要素),分類(classification赏寇,將分割后的區(qū)塊歸類)吉嫩;圖像質(zhì)量/信息量處理(image post processing,如用生成的方法提高圖像分辨率嗅定、圖像降噪等)自娩。這些處理方式與自然影像的處理方式非常類似。例如渠退,自動(dòng)駕駛相關(guān)的圖像處理也需要在連續(xù)的圖像里用邊界框圈出機(jī)動(dòng)車忙迁、非機(jī)動(dòng)車、行人等物體碎乃。
底層處理完成后姊扔,就可以根據(jù)接下來要解決的具體問題開發(fā)上層應(yīng)用了。比如梅誓,它可以幫幫忙幫到底——幫醫(yī)生找到病灶之后恰梢,把報(bào)告也一起寫了。當(dāng)模型能夠?qū)Φ讓拥姆治鼋Y(jié)果進(jìn)行語義層面的歸納總結(jié)证九,并且針對(duì)需要報(bào)告的內(nèi)容進(jìn)行系統(tǒng)的訓(xùn)練删豺,轉(zhuǎn)換成自然語言形式的報(bào)告就不是太難的事情了。
當(dāng)計(jì)算機(jī)對(duì)圖像中的生理結(jié)果和病灶有了認(rèn)知之后愧怜,就可以在此之上完成更多高級(jí)任務(wù)呀页。比如計(jì)算機(jī)也可以通過力學(xué)和熱力學(xué)仿真完成大量的組織動(dòng)態(tài)功能重現(xiàn)、手術(shù)規(guī)劃工作拥坛。比如蓬蝶,對(duì)心臟冠狀動(dòng)脈增強(qiáng) CT 進(jìn)行底層處理、重建出心臟血管的管腔和管壁的位置之后猜惋,算法可以進(jìn)一步進(jìn)行流體力學(xué)仿真丸氛,重現(xiàn)血液在血管內(nèi)流動(dòng)的情況,用于輔助評(píng)估一種有創(chuàng)介入檢查 FFR 才能獲得的冠心病診斷信息著摔。熱力學(xué)模擬的例子也很多缓窜。比如在病灶消融前,通過模擬不同的探針溫度谍咆、位置禾锤,選擇最合適的方案。在放射性療法里摹察,射線無法轉(zhuǎn)彎恩掷,所以要確定合適的角度,保證不打到重要的器官供嚎,又能盡可能消除腫瘤黄娘;射線的副作用也很大峭状,所以要慎重選擇劑量,來達(dá)到理想的效果…… 帶模擬的手術(shù)規(guī)劃就好像把手術(shù)這件原來只有一次機(jī)會(huì)的演出逼争,變成了可以提前一個(gè)月「實(shí)地有道具彩排」的活動(dòng)优床。
不僅僅是這些致命的「疑難雜癥」,隨著醫(yī)學(xué)手段的不斷進(jìn)步氮凝,當(dāng)一項(xiàng)病癥治愈的希望變得很大的羔巢,術(shù)后生活質(zhì)量就變成了一項(xiàng)重要的考量,而醫(yī)療影像支持的手術(shù)模擬在這里的施展空間同樣很大罩阵。例如,「前列腺癌」雖然聽起來很嚴(yán)重启摄,但隨著根除手術(shù)的普及已經(jīng)變得幾乎不致命了稿壁。但是醫(yī)生逐漸發(fā)現(xiàn),術(shù)后很多病人會(huì)出現(xiàn)尿失禁癥狀歉备。研究發(fā)現(xiàn)傅是,是前列腺的切除影響了膀胱與尿道的壓力平衡,單靠尿道括約肌本身的力量不足以抵抗來自膀胱的壓力蕾羊。于是醫(yī)生開始利用醫(yī)療影像技術(shù)做模擬:在術(shù)前拍攝膀胱有水情景下的 MRI喧笔,進(jìn)行有重力、甚至跳躍情境下幾倍重力的尿道受力模擬龟再,確保其外部壓力一直大于內(nèi)部壓力书闸。這就是充分利用計(jì)算機(jī)的「算力」,做人眼之所不能利凑。
一張影像的應(yīng)用場景已經(jīng)如此豐富了浆劲,然而多張影像的之上能玩出的花樣只有更多。
配準(zhǔn)(registration)是把不同掃描序列按照生理結(jié)構(gòu)對(duì)齊達(dá)到重合的目的哀澈,用于對(duì)比不同檢查中的差異牌借。所以秒咨,影像的背景部分可以大刀闊斧地調(diào)整剑逃,通過變形變換(deformation transformation)大莫,把病人每次拍照時(shí)因?yàn)樽藙莸牟煌爻旱降那惑w部位不同而導(dǎo)致的無法重合問題通過形狀云茸、大小腰奋、角度的變換來進(jìn)行對(duì)準(zhǔn)裆赵,保證多組照片之間互相可比豆赏。而病灶部分只能嚴(yán)謹(jǐn)?shù)匚⒄{(diào)束凑,通過只有六個(gè)空間自由度(dof)的剛體變換(rigid transformation)進(jìn)行旋轉(zhuǎn)和位移晒旅,保證病灶信息不損失。
融合(fusion)指的是同一病人的不同種類的影像的重疊汪诉,旨在把不同類型影像中獲得的信息進(jìn)行綜合废恋。比如 CT 可以觀察到病灶的位置谈秫、結(jié)構(gòu),卻沒法了解其代謝情況鱼鼓。如果同時(shí)拍攝 PET 核影像(Positron Emission Tomography拟烫,將發(fā)射正電子的放射性核素標(biāo)記到能夠參與血流或代謝過程的化合物上,注射到受檢者體內(nèi))迄本,同位素會(huì)聚集到代謝旺盛的地方硕淑,但是無法看清結(jié)構(gòu)。拍攝的雖然是「一模一樣」的內(nèi)容嘉赎,但卻會(huì)獲得兩張「完全不像」的影像置媳,但是計(jì)算機(jī)影像系統(tǒng)神奇的地方就在于:完全不像也能對(duì)齊!對(duì)齊之后公条,醫(yī)生就能夠同時(shí)獲得結(jié)構(gòu)與代謝信息拇囊,可以量化地對(duì)用藥效果做預(yù)測。
雖然表面上看起來靶橱,所有醫(yī)療相關(guān)的創(chuàng)業(yè)公司都在做心臟影像寥袭、肺部影像,但大多是完成類似的底層處理关霸,事實(shí)上传黄,進(jìn)入到上層應(yīng)用領(lǐng)域的醫(yī)療影像還是一片「處處皆藍(lán)海」的汪洋队寇,切入角度不同膘掰、目標(biāo)問題不同,影像的用法也就完全不同英上。
體素選擇了三個(gè)方向發(fā)力炭序。其中兩個(gè)致力于解決大型醫(yī)療機(jī)構(gòu)中現(xiàn)有的臨床問題,一個(gè)旨在滿足醫(yī)療機(jī)構(gòu)觸及不到苍日、但是民間仍然呼喚技術(shù)解決方案的需求惭聂。
在與美國的 Cedars-Sinai 醫(yī)療中心、中國的協(xié)和醫(yī)院等大型醫(yī)療機(jī)構(gòu)的合作中相恃,體素想攬下那些「人不愿意做」和「人不適合做」的工作辜纲。
「人不愿意做」的是那些重復(fù)性的、效率低下的工作:找病灶拦耐、量化病灶耕腾、隨訪對(duì)比都屬于這一類任務(wù)。這一類任務(wù)看似簡單杀糯,其實(shí)對(duì)使用場景場合設(shè)計(jì)作出了相當(dāng)高的要求扫俺。「許多人對(duì)場景問題有誤區(qū)在固翰,認(rèn)為做重病狼纬、大病使用量最大羹呵。其實(shí)這里面存在邏輯倒掛。一個(gè)面向某『重病大病』的產(chǎn)品理論上是要面向潛在患病群體疗琉。然而一位來到醫(yī)院的咳嗽患者真的需要一個(gè)『尭曰叮看肺癌,準(zhǔn)確率極高盈简,但是其他肺病一概不會(huì)看』的模型嗎凑耻?」答案顯而易見∧停「『是否有重病大病』是重要的后驗(yàn)知識(shí)香浩,回顧時(shí)候有用,前瞻時(shí)候种吸,沒用弃衍。」
「人不適合做」的種種工作里坚俗,最常見的是「考眼力」。醫(yī)療影像那些細(xì)小的蛛絲馬跡岸裙,常常小到難以刺激人眼捕捉相關(guān)模式猖败。比如心血管鈣化程度量化,再細(xì)心的醫(yī)生也沒精力逐條小血管進(jìn)行檢查降允,然而計(jì)算機(jī)是可以的恩闻,所以「心腦血管風(fēng)險(xiǎn)量化」由不可能變成了可能。
除此之外剧董,還有大量在數(shù)量和難度上無法被醫(yī)療機(jī)構(gòu)處理的問題幢尚。在百萬、千萬人規(guī)模上進(jìn)行特定疾病篩查翅楼;為尚無表達(dá)能力配合醫(yī)院檢查的患兒做被動(dòng)的視力障礙檢查……「醫(yī)院做不了尉剩,民間做不了,全然的藍(lán)海毅臊,這樣的應(yīng)用深入挖掘的話理茎,還有非常多」苕遥」采訪過程中皂林,丁曉偉從頭至尾沒有提到同業(yè)競爭,只有做不過來的項(xiàng)目蚯撩,和解決不完的新問題础倍。
從業(yè)者眼里的技術(shù)壁壘和破壁方向
定義了研究對(duì)象,了解了研究方法胎挎,接下來我們談?wù)剺I(yè)內(nèi)人士眼里這個(gè)領(lǐng)域的「邊界」沟启。
「我專門拿這個(gè)問題問了很多周圍的研究者忆家,這是一個(gè)匯總而來的答案∶榔郑」弦赖,兩個(gè)小時(shí)的采訪里,這是丁曉偉第一次拿起手機(jī)浦辨。
首先是如何降低標(biāo)記數(shù)據(jù)的成本和工作量蹬竖。
一位成熟的影像科醫(yī)生需要八年學(xué)習(xí)與更長時(shí)間的臨床經(jīng)驗(yàn)。即使人工智能所催生的數(shù)據(jù)標(biāo)注行業(yè)發(fā)展再快流酬,也很難培養(yǎng)出具有類似相應(yīng)水平的標(biāo)注員币厕。更何況,即使是專業(yè)人士之間芽腾,觀察者方差也很大旦装。兩位醫(yī)生標(biāo)記同一張影像,結(jié)果也可能相差甚遠(yuǎn)摊滔。
因此阴绢,不斷有新的標(biāo)記簡化方法被開發(fā)出來。類似自然影像領(lǐng)域的迭代標(biāo)記很快被采用:初始模型完成開發(fā)之后艰躺,立刻接棒大規(guī)模標(biāo)記工作呻袭,人工轉(zhuǎn)而花在質(zhì)量控制工作上。還有一些從一開始就試圖以更加系統(tǒng)化的思路拆分問題的方法:如果一個(gè)萬張規(guī)模的數(shù)據(jù)庫擺在你面前腺兴,你只有能力標(biāo)注兩千張左电,那么你選擇哪兩千?這是一個(gè)復(fù)雜的統(tǒng)計(jì)學(xué)采樣問題:要在無監(jiān)督的前提下页响,選擇兩千張既能貢獻(xiàn)平衡的分布篓足、又能反映典型特征、還能照顧到異常值的數(shù)據(jù)闰蚕。這是一個(gè)直接影響最終模型質(zhì)量的關(guān)鍵選擇栈拖。
然后是多任務(wù)(multi-tasking)模型的開發(fā)。
醫(yī)療影像問題基本可以拆解成一串彼此相連的問題:找到異常位置陪腌、判斷異常類型辱魁、量化異常大小,再加上開始治療后的隨訪對(duì)比诗鸭。既然選擇做分析染簇,就沒有只做一項(xiàng)的道理∏堪叮可是如果每一個(gè)環(huán)節(jié)都用專門模型做锻弓,一張圖要被來回調(diào)用三、四遍蝌箍,模型間還不能相互借鑒經(jīng)驗(yàn)青灼,這對(duì)于計(jì)算資源和醫(yī)療資源暴心,都是一種浪費(fèi)。
能不能無縫地把幾項(xiàng)任務(wù)銜接起來杂拨?找病灶的同時(shí)能否完成分割與分類呢专普?在多任務(wù)意識(shí)上,醫(yī)療影像界和自然影像界可以說不謀而合弹沽。Facebook 的何愷明于 CVPR 2016 發(fā)表的論文就是以多任務(wù) CNN 為主題檀夹。實(shí)踐證明,聯(lián)合任務(wù)的效率與表現(xiàn)比單獨(dú)完成任何一個(gè)任務(wù)都要高策橘。
此外還有多實(shí)例認(rèn)知(multi-instance awareness)炸渡。
如今的分割算法可以把圖像中的淋巴結(jié)區(qū)域從非淋巴結(jié)區(qū)域里分割出來。卻沒辦法把一團(tuán)淋巴結(jié)彼此區(qū)分開來丽已。在實(shí)際治療里蚌堵,可能淋巴結(jié)「張三」需要整體切除,淋巴結(jié)「李四」卻值得部分保留沛婴『鹞罚可惜分割模型是個(gè)臉盲患者,面對(duì)病灶出現(xiàn)在多個(gè)實(shí)例上的「多發(fā)情況」嘁灯,只能機(jī)械地對(duì)所有實(shí)例一視同仁宫仗。無差別對(duì)待不可行,所以需要讓模型有能區(qū)分「張三」和「李四」的能力旁仿。
而最重要的,是對(duì)醫(yī)療大數(shù)據(jù)的定義和利用孽糖。
雖然單張數(shù)據(jù)信息量很大枯冈,但如今以千、萬為數(shù)據(jù)單位的醫(yī)學(xué)影像和以百萬办悟、千萬為規(guī)模的自然影像相比尘奏,還遠(yuǎn)不能算一個(gè)「大數(shù)據(jù)」問題。差距不僅體現(xiàn)在橫向比較病蛉,如今拿出來能用的醫(yī)療數(shù)據(jù)和醫(yī)院里存儲(chǔ)的數(shù)據(jù)相比也是九牛一毛炫加。
「真正的大數(shù)據(jù),是就把躺在醫(yī)院數(shù)據(jù)庫里的數(shù)據(jù)铺然、就把臨床過程里記錄下來的數(shù)據(jù)拿出來用俗孝。」所以魄健,不懂自然語言的計(jì)算機(jī)視覺專家不是好的醫(yī)療影像研究者赋铝。醫(yī)生的病例報(bào)告里對(duì)病灶位置的描述,就是最好的標(biāo)注沽瘦。把文字轉(zhuǎn)換成邊界框革骨,再轉(zhuǎn)換為算法的訓(xùn)練集农尖。只有不需要刻意進(jìn)行的數(shù)據(jù)標(biāo)注,才是處理百萬良哲、千萬級(jí)別數(shù)據(jù)的辦法盛卡,才是醫(yī)療大數(shù)據(jù)問題的答案。這是為醫(yī)療影像領(lǐng)域「修高速公路」的工作筑凫,什么時(shí)候這條高速公路通車了滑沧,什么時(shí)候醫(yī)療影像才能真正進(jìn)入「大數(shù)據(jù)時(shí)代」。Nvdia 和 NIH 的 Le Lu 博士的工作代表了這個(gè)方向的先進(jìn)成果漏健。
體素的公司愿景里嚎货,有一條是「提供醫(yī)療語義級(jí)別的醫(yī)學(xué)影像知識(shí)圖譜 API」。采訪開始前蔫浆,我曾經(jīng)對(duì)這個(gè)用兩組形容詞就橫跨了計(jì)算機(jī)視覺和自然語言處理的說法感到困惑殖属。
原來為了醫(yī)療這個(gè)崇高的目標(biāo),真的有研究者踏上了修建溝通語言與圖像的巴比倫塔的征途瓦盛。