單細(xì)胞軟件學(xué)習(xí)--泛癌的TME細(xì)胞類型分類工具scATOMIC(single cell annotation of tumour microenvironments in pan-cancer ...

一、背景簡述

腫瘤微環(huán)境(Tumor micro-environment, TME)是指腫瘤細(xì)胞周圍異于正常內(nèi)環(huán)境的微環(huán)境眶明,具有缺氧申鱼、慢性炎癥及免疫抑制的三個(gè)特征。TME 包括多種免疫細(xì)胞浅缸,以及癌相關(guān)成纖維細(xì)胞、內(nèi)皮細(xì)胞魄咕、周細(xì)胞和各種其他組織細(xì)胞類型衩椒,不同組織的TME會形成十分復(fù)雜的機(jī)制網(wǎng)絡(luò), 對腫瘤的進(jìn)一步發(fā)展有重要作用。相比常規(guī)研究技術(shù)哮兰,單細(xì)胞測序可以提供每個(gè)細(xì)胞的轉(zhuǎn)錄組信息毛萌,反映出不同細(xì)胞類型及其功能狀態(tài)的改變,更適合研究TME的變化喝滞。
但是阁将,目前單細(xì)胞數(shù)據(jù)識別惡性細(xì)胞大都是通過推斷細(xì)胞的染色體倍數(shù)分類,并不能提供有關(guān)癌癥起源組織的明確信息右遭,也沒有通用方法對異質(zhì)非惡性 TME 細(xì)胞及腫瘤細(xì)胞進(jìn)行有效做盅、詳細(xì)的分類。
基于以上需求窘哈,加拿大安大略省癌癥研究所的研究人員設(shè)計(jì)了一個(gè)全面吹榴、泛癌的TME細(xì)胞類型分類工具scATOMIC(single cell annotation of tumour microenvironments in pan-cancer settings),通過反向?qū)哟畏诸惡透腹?jié)點(diǎn)重復(fù)消除的算法(RHC-REP)改進(jìn)細(xì)胞分類滚婉,降低 TME 多細(xì)胞系統(tǒng)的轉(zhuǎn)錄組復(fù)雜性图筹,對惡性和非惡性細(xì)胞進(jìn)行模塊化注釋。
軟件更新維護(hù)在https://github.com/abelson-lab/scATOMIC让腹,需要在R環(huán)境下運(yùn)行远剩。

二、軟件主要步驟和結(jié)果驗(yàn)證

為了 準(zhǔn)確的區(qū)分不同類型細(xì)胞的特征骇窍,研究團(tuán)隊(duì)使用超過30萬個(gè)細(xì)胞的數(shù)據(jù)集(包括癌癥瓜晤、免疫和基質(zhì)細(xì)胞)進(jìn)行隨機(jī)森林的模型訓(xùn)練,通過RHC-REP算法得到與父節(jié)點(diǎn)總數(shù)相對應(yīng)的 24 個(gè)模型腹纳,并定義了19種常見癌癥的泛癌癥數(shù)據(jù)參照痢掠。

圖1 細(xì)胞分型模型
1.細(xì)胞類型父節(jié)點(diǎn)的分類(n ?= 24)

父節(jié)點(diǎn)代表更寬泛的細(xì)胞分類哈恰,終末節(jié)點(diǎn)代表詳細(xì)的細(xì)胞類別。根據(jù)已知細(xì)胞類型的轉(zhuǎn)錄組數(shù)據(jù)集志群,軟件在一個(gè)父節(jié)點(diǎn)內(nèi)着绷,根據(jù)基因差異表達(dá)評分 (DES) ,篩選出可以顯著區(qū)分該細(xì)胞類型與所有其他細(xì)胞類型的差異基因锌云,最后保留對每個(gè)末端類別具有更高特異性的差異表達(dá)基因 (DEG)荠医。如圖2,熱圖頂部的顏色表示不同的細(xì)胞類型桑涎,經(jīng)過 RHC-REP 多次迭代后彬向,找到該細(xì)胞類型最高特異性的DEG基因。


圖2 細(xì)胞類型的模型迭代

具體方法類似于我們的差異分析 攻冷,對于每個(gè)模型使用 FindMarkers 函數(shù)(Wilcoxon )找到每個(gè)細(xì)胞類型的 DEG 列表:log 2倍數(shù)變化至少為 0.25娃胆,并且 ident.1 或 ident.2 中至少有 10% 的細(xì)胞表達(dá)各自的基因。差異表達(dá)評分為 ident.1 和 ident.2 中各自 DEG 表達(dá)非零值的細(xì)胞分?jǐn)?shù)的差異 等曼,對于每種終末細(xì)胞類型里烦,我們保留的基因的 DES 大于該細(xì)胞類型的所有 DEG 的平均 DES。這里需要去除了所有核糖體基因禁谦,同時(shí)刪除 ident.2 >40% 的 DEG胁黑,以確保 DEG基因在任何特定細(xì)胞類型中的表達(dá)特異性 。(線粒體基因前期質(zhì)控過濾 < 0.25)州泊。為了保證在不同的數(shù)據(jù)集之間軟件的穩(wěn)定性和性能丧蘸,每種細(xì)胞類型特異性的 DEG 基因數(shù)目最小為50,至多 200個(gè)遥皂,在 DES 高于平均值的 DEG 少于 50 個(gè)的情況下力喷,我們保留按 DES 排名的前 50 個(gè) DEG。

2.隨機(jī)森林分類器模型構(gòu)建

對經(jīng)過過濾的數(shù)據(jù)矩陣導(dǎo)入該節(jié)點(diǎn)的模型演训,計(jì)算每個(gè)細(xì)胞在父節(jié)點(diǎn)內(nèi)的所有終末類的樹比例的預(yù)測分?jǐn)?shù) 弟孟,然后 將所有血液和非血細(xì)胞亞型的預(yù)測分?jǐn)?shù)(PS)分別相加,得出將單細(xì)胞與其適當(dāng)?shù)挠H本類別相關(guān)聯(lián)的中間組分?jǐn)?shù)(IGS)分布仇祭。如果細(xì)胞的 IGS 低于置信截止值披蕉,則返回到寬泛的上級細(xì)胞分類。 同理乌奇,在下一個(gè)父節(jié)點(diǎn)的相應(yīng)模型處繼續(xù)迭代,直到獲得最終分類眯娱。

圖3 隨機(jī)森林分類器
三礁苗、模型評估和驗(yàn)證

團(tuán)隊(duì)對大量公開數(shù)據(jù)進(jìn)行了測試和分析,以綜合評估 scATOMIC 的普適性和準(zhǔn)確度徙缴。

1.對多個(gè)泛癌 TME數(shù)據(jù)集進(jìn)行分析试伙,每個(gè)數(shù)據(jù)集的細(xì)胞類型被隨機(jī)分為 5 等份子數(shù)據(jù)集嘁信,每個(gè)細(xì)胞類型的 F1 分?jǐn)?shù)(二分類模型,準(zhǔn)確度)均在0.9以上疏叨。表明軟件對TME 環(huán)境下的細(xì)胞識別能力具有普適性潘靖,但是對黑色素瘤數(shù)據(jù)表現(xiàn)不佳;


圖4 模型評估和驗(yàn)證

2.在肺癌/乳腺癌數(shù)據(jù)集的應(yīng)用中蚤蔓,可以對NK細(xì)胞和T 細(xì)胞進(jìn)一步細(xì)化亞型卦溢,提升細(xì)胞類型分辨率。 這表明在高分辨率解析細(xì)胞類型時(shí)秀又,軟件可以識別稀有細(xì)胞類型单寂,避免對未知細(xì)胞進(jìn)行錯(cuò)誤分類以及確定癌癥細(xì)胞的類型。

圖5 細(xì)化細(xì)胞類型

3.在轉(zhuǎn)移癌癥數(shù)據(jù)中吐辙, 對不同解剖部位的乳腺癌宣决、腎癌、肺癌昏苏、卵巢癌和皮膚癌的 62 個(gè)轉(zhuǎn)數(shù)據(jù)進(jìn)行分析尊沸,正確預(yù)測了52 個(gè)樣本中的癌癥細(xì)胞原發(fā)組織。這表明軟件可以輔助識別或預(yù)測部分腫瘤的起源贤惯。

圖6 預(yù)測腫瘤的起源

三椒丧、結(jié)果展示

在實(shí)際的數(shù)據(jù)分析中,我們以公司流程的 rds/h5seurat 作為輸入文件(counts 信息)救巷,通過 run_scATOMIC 函數(shù)預(yù)測細(xì)胞的類型壶熏,并輸出對應(yīng)的feature 圖和注釋表格。

1.人工鑒定和軟件鑒定細(xì)胞類型
如下圖浦译,可以看出高分辨率導(dǎo)致基質(zhì)細(xì)胞棒假,T/NK細(xì)胞的類型更細(xì)化,但是免疫細(xì)胞精盅,腫瘤細(xì)胞與人工注釋的細(xì)胞類型大致相同帽哑。

image.png

2.軟件注釋細(xì)胞類型表格
new_celltype 為人工注釋細(xì)胞類型,scATOMIC_pred 為軟件注釋細(xì)胞類型叹俏,pan_cancer_cluster 為腫瘤/ 非腫瘤分類妻枕。classification_confidence 為可信度,軟件一般輸出low_confidence粘驰,嚴(yán)格符合模型閾值的則為confident屡谐。


企業(yè)微信截圖_17091728482557.png

3.樹形圖展示細(xì)胞分類
軟件可視化部分還提供了細(xì)胞分化的樹形圖,方便追溯感興趣細(xì)胞的來源和分化軌跡蝌数。


image.png
四愕掏、結(jié)語

scATOMIC通過大量的細(xì)胞數(shù)據(jù)集建立了可靠的數(shù)據(jù)模型,能夠準(zhǔn)確的識別TME的癌癥和正常組織細(xì)胞顶伞,以及確定腫瘤起源饵撑,為我們解析TME環(huán)境中復(fù)雜的細(xì)胞行為提供了新的工具剑梳,也將進(jìn)一步豐富和促進(jìn)泛癌的研究。

參考文獻(xiàn):
[1]:Nofech-Mozes I, Soave D, Awadalla P, Abelson S. Pan-cancer classification of single cells in the tumour microenvironment. Nat Commun. 2023 Mar 23;14(1):1615. doi: 10.1038/s41467-023-37353-8. PMID: 36959212; PMCID: PMC10036554.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末滑潘,一起剝皮案震驚了整個(gè)濱河市垢乙,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌语卤,老刑警劉巖追逮,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異粱侣,居然都是意外死亡羊壹,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進(jìn)店門齐婴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來油猫,“玉大人,你說我怎么就攤上這事柠偶∏檠” “怎么了?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵诱担,是天一觀的道長毡证。 經(jīng)常有香客問我,道長蔫仙,這世上最難降的妖魔是什么料睛? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮摇邦,結(jié)果婚禮上恤煞,老公的妹妹穿的比我還像新娘。我一直安慰自己施籍,他們只是感情好居扒,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著丑慎,像睡著了一般喜喂。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上竿裂,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天玉吁,我揣著相機(jī)與錄音,去河邊找鬼铛绰。 笑死诈茧,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的捂掰。 我是一名探鬼主播敢会,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼这嚣!你這毒婦竟也來了鸥昏?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤姐帚,失蹤者是張志新(化名)和其女友劉穎吏垮,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體罐旗,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡膳汪,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了九秀。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片遗嗽。...
    茶點(diǎn)故事閱讀 40,137評論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖鼓蜒,靈堂內(nèi)的尸體忽然破棺而出痹换,到底是詐尸還是另有隱情,我是刑警寧澤都弹,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布娇豫,位于F島的核電站,受9級特大地震影響畅厢,放射性物質(zhì)發(fā)生泄漏冯痢。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一框杜、第九天 我趴在偏房一處隱蔽的房頂上張望浦楣。 院中可真熱鬧,春花似錦霸琴、人聲如沸椒振。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽澎迎。三九已至,卻和暖如春选调,著一層夾襖步出監(jiān)牢的瞬間夹供,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工仁堪, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留哮洽,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓弦聂,卻偏偏與公主長得像鸟辅,于是被迫代替她去往敵國和親氛什。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,086評論 2 355

推薦閱讀更多精彩內(nèi)容