240428 文獻(xiàn)閱讀-Transparent medical image AI via an image–text foundation model grounded in medical l...

Transparent Medical Image AI via MONET Model

[1] Kim C, Gadgil S U, DeGrave A J, et al. Transparent medical image AI via an image–text foundation model grounded in medical literature[J]. Nature Medicine, 2024, 30(4): 1154-1165.

Overview

The study introduces MONET (medical concept retriever), an image-text foundation model designed to enhance the transparency and trustworthiness of medical artificial intelligence (AI) systems. MONET connects medical images with text and provides dense scoring on concept presence, which is crucial for various tasks in medical AI development and deployment.

Key Features of MONET

  • Concept Annotation: MONET can annotate medical images with semantically meaningful concepts.
  • Training Data: Trained on 105,550 dermatological images paired with descriptions from medical literature.
  • Performance: Competes with supervised models built on clinically annotated datasets.
  • Use Cases: Enables AI transparency across the development pipeline, including data auditing, model auditing, and interpretation.

Dermatology as a Use Case

  • Dermatology was chosen due to the heterogeneity in diseases, skin tones, and imaging modalities.
  • MONET's annotation capability was verified by board-certified dermatologists.

Technical Approach

  • Contrastive Learning: Utilizes an AI technique to leverage natural language descriptions directly on images.
  • Encoder: Transforms images and text into a lower-dimensional vector space, forcing paired elements to be close and unpaired elements to be distant.

對(duì)比學(xué)習(xí)(Contrastive Learning)

目的:對(duì)比學(xué)習(xí)是一種人工智能技術(shù),用于使模型能夠直接利用圖像上的自然語言描述。
方法:通過訓(xùn)練,使得同一圖像-文本對(duì)在表示空間中彼此靠近军援,而不同對(duì)的表示則彼此遠(yuǎn)離伤极。
模型架構(gòu):

  • 圖像編碼器(Image Encoder):使用視覺變換器架構(gòu)(如ViT-L/14)椿息,將輸入圖像轉(zhuǎn)換為一個(gè)固定維度的嵌入向量鸿捧。
  • 文本編碼器(Text Encoder):采用具有多層自注意力機(jī)制的變換器架構(gòu)泻轰,將文本轉(zhuǎn)換為相應(yīng)的嵌入向量铺然。

數(shù)據(jù)預(yù)處理

  • 圖像:調(diào)整圖像大小俗孝,進(jìn)行中心裁剪和標(biāo)準(zhǔn)化處理,以符合編碼器的輸入要求魄健。
  • 文本:使用小寫字節(jié)對(duì)編碼進(jìn)行標(biāo)記化赋铝,并對(duì)超長(zhǎng)文本進(jìn)行分割

訓(xùn)練過程

  • 損失函數(shù):使用對(duì)稱的交叉熵?fù)p失函數(shù),基于余弦相似度評(píng)分沽瘦。
  • 優(yōu)化器:采用Adam優(yōu)化器革骨,并使用余弦學(xué)習(xí)率調(diào)度策略农尖。
  • 超參數(shù)調(diào)整:通過將數(shù)據(jù)集分為訓(xùn)練集和驗(yàn)證集,選擇最佳的批次大小和學(xué)習(xí)率良哲。

自動(dòng)概念注釋

  • 原理:訓(xùn)練完成后盛卡,MONET能夠測(cè)量圖像與任意文本的接近程度,用于自動(dòng)注釋概念筑凫。
  • 方法:通過計(jì)算圖像嵌入和概念提示嵌入之間的余弦相似度窟扑,得到概念存在分?jǐn)?shù)。

數(shù)據(jù)審計(jì)

  • 概念差異分析:利用MONET將圖像集映射到共同的嵌入空間漏健,以自然語言描述圖像集之間的不同特征嚎货。

模型審計(jì)

  • MA-MONET:通過聚類測(cè)試集圖像,并比較低性能和高性能圖像集之間的概念存在分?jǐn)?shù)蔫浆,以識(shí)別導(dǎo)致模型錯(cuò)誤的醫(yī)學(xué)概念殖属。

構(gòu)建固有可解釋的神經(jīng)網(wǎng)絡(luò)(Concept Bottleneck Models, CBMs)
目的:創(chuàng)建一個(gè)可解釋的模型,使醫(yī)生或開發(fā)者能夠理解影響模型決策的因素瓦盛。
方法:利用MONET自動(dòng)注釋的概念來構(gòu)建瓶頸層洗显,然后在此層上訓(xùn)練一個(gè)簡(jiǎn)單的線性分類器。
評(píng)估設(shè)置

  • 預(yù)測(cè)目標(biāo):區(qū)分惡性和良性病變原环,以及黑色素瘤與其類似病變挠唆。
  • 圖像類型:臨床圖像和皮膚鏡圖像。
  • 訓(xùn)練與測(cè)試:使用不同的訓(xùn)練-測(cè)試分割重復(fù)評(píng)估嘱吗,以驗(yàn)證模型性能玄组。

統(tǒng)計(jì)分析

  • AUROC值:通過不同的訓(xùn)練-測(cè)試集運(yùn)行獲得,并使用配對(duì)樣本學(xué)生t檢驗(yàn)來比較MONET與其他方法的性能谒麦。

臨床試驗(yàn)評(píng)估

  • PROVE-AI研究:使用MONET對(duì)ADAE算法的臨床試驗(yàn)進(jìn)行復(fù)制和評(píng)估俄讹,分析與低特異性相關(guān)的概念。

數(shù)據(jù)和代碼可用性

  • 數(shù)據(jù)集:使用的是公開可訪問的數(shù)據(jù)集绕德,如ISIC患膛、Derm7pt、Fitzpatrick 17k和DDI耻蛇。
  • 代碼:分析中使用的代碼可在GitHub上獲得踪蹬,包括數(shù)據(jù)收集、模型訓(xùn)練和基準(zhǔn)研究的腳本臣咖。

Results

  • Automatic Concept Annotation: MONET successfully retrieves relevant clinical and dermoscopic images for various dermatological terms.
  • Performance Assessment: Compared favorably with supervised learning and CLIP models.
  • Diverse Skin Tones: MONET demonstrated consistent performance across different skin tones.
  • Nonclinical Concepts: Identified irrelevant artifacts that can affect AI predictions.

Data and Model Auditing

  • Data Auditing: MONET automatically examines datasets for irregularities, aiding in the auditing of large-scale datasets.
  • Model Auditing: A method called MA-MONET was developed to detect medical concepts leading to model errors.

Inherently Interpretable Models

  • MONET facilitates the creation of Concept Bottleneck Models (CBMs), which are inherently interpretable and allow physicians to understand factors influencing model decisions.

Real-world Application

  • MONET was applied to assess a clinical trial of a dermatology AI algorithm, providing insights into cases of lower specificity.

Limitations and Future Work

  • MONET may struggle with concepts not present in its training data.
  • Performance across skin tones for dermoscopic images was not examined due to dataset limitations.
  • MONET is not intended for diagnostic tasks and may exhibit biases present in the training data.

Conclusion

The MONET model presents a significant advancement in the transparency and interpretability of medical image AI, with potential applications in auditing, model development, and clinical deployment.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末跃捣,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子亡哄,更是在濱河造成了極大的恐慌枝缔,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蚊惯,死亡現(xiàn)場(chǎng)離奇詭異愿卸,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)截型,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門趴荸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人宦焦,你說我怎么就攤上這事发钝。” “怎么了波闹?”我有些...
    開封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵酝豪,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我精堕,道長(zhǎng)孵淘,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任歹篓,我火速辦了婚禮瘫证,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘庄撮。我一直安慰自己背捌,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開白布洞斯。 她就那樣靜靜地躺著毡庆,像睡著了一般。 火紅的嫁衣襯著肌膚如雪烙如。 梳的紋絲不亂的頭發(fā)上扭仁,一...
    開封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天,我揣著相機(jī)與錄音厅翔,去河邊找鬼乖坠。 笑死,一個(gè)胖子當(dāng)著我的面吹牛刀闷,可吹牛的內(nèi)容都是我干的熊泵。 我是一名探鬼主播,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼甸昏,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼顽分!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起施蜜,我...
    開封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤卒蘸,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體缸沃,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡恰起,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了趾牧。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片检盼。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖翘单,靈堂內(nèi)的尸體忽然破棺而出吨枉,到底是詐尸還是另有隱情,我是刑警寧澤哄芜,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布貌亭,位于F島的核電站,受9級(jí)特大地震影響认臊,放射性物質(zhì)發(fā)生泄漏圃庭。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一美尸、第九天 我趴在偏房一處隱蔽的房頂上張望冤议。 院中可真熱鬧,春花似錦师坎、人聲如沸恕酸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蕊温。三九已至,卻和暖如春遏乔,著一層夾襖步出監(jiān)牢的瞬間义矛,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來泰國打工盟萨, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留凉翻,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓捻激,卻偏偏與公主長(zhǎng)得像制轰,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子胞谭,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容