隔離的第三天坡倔,一個人的日子總是很難熬抄肖,沒辦法若专,孤獨總是常伴我身许蓖,今天我們分享的文獻在Atlas of clinically distinct cell states and ecosystems across human solid tumors, 2021年10月發(fā)表于cell,其中文章中開發(fā)了一種表征細胞狀態(tài)和生態(tài)型的分析方法调衰,EcoTyper 膊爪,我們就來一探究竟
核心:無論是正常組織還是腫瘤發(fā)生,絕不是單一細胞類型起作用嚎莉,而是幾種細胞類型組成多細胞communities米酬,組成了最小的功能單元,個體差異趋箩,預后的不同赃额,皆是因為這個communities的不同,或許叫确,借此跳芳,單細胞空間可以運用到臨床方向。
In brief
EcoTyper 是一種機器學習框架启妹,用于從基因表達數(shù)據(jù)中識別和表征細胞狀態(tài)和生態(tài)系統(tǒng),它可以深入了解人類癌癥的細胞landscope和群落結(jié)構(gòu)醉旦,這是癌癥相關死亡率的主要原因饶米。
Highlights
EcoTyper enables large-scale profiling of cell states and multicellular ecosystems
Applicable to bulk, single-cell, and spatially resolved gene expression data(bulk桨啃、單細胞、空間數(shù)據(jù)全部可以用)
A reference atlas of 69 cell states and 10 ecosystems across 16 types of carcinoma
Carcinoma ecosystems have distinct biology, clinical outcomes, and spatial topology.
SUMMARY
確定細胞如何隨其局部信號環(huán)境而變化并組織成不同的細胞群對于理解發(fā)育檬输、衰老和癌癥等多樣化過程至關重要照瘾。在這里,開發(fā)了 EcoTyper丧慈,這是一種機器學習框架析命,用于從bulk、單細胞和空間分辨的基因表達數(shù)據(jù)中大規(guī)模識別和驗證細胞狀態(tài)和多細胞群落逃默。當應用于 16 種人類癌癥的 12 種主要細胞譜系時鹃愤,EcoTyper 確定了 69 種轉(zhuǎn)錄定義的細胞狀態(tài)。大多數(shù)狀態(tài)是腫瘤組織特有的完域,在各種腫瘤類型中普遍存在软吐,并且具有顯著的預后意義。通過分析細胞狀態(tài)共現(xiàn)模式吟税,發(fā)現(xiàn)了十個臨床上不同的多細胞群落凹耙,具有出乎意料的強保護性,其中三個具有與不良生存相關的骨髓和基質(zhì)成分肠仪,一個富含正常組織肖抱,兩個與早期癌癥發(fā)展有關。這項研究闡明了人類癌癥中細胞組織的基本單位异旧,并為大規(guī)模分析任何組織中的細胞生態(tài)系統(tǒng)提供了框架意述。
INTRODUCTION
在癌癥中,相互作用的細胞類型的復雜群落形成了影響腫瘤發(fā)生的強大信號網(wǎng)絡(這個其實很多文章多次暗示過泽艘,細胞是形成社區(qū)來發(fā)揮作用)欲险。操縱這些網(wǎng)絡的有針對性的策略正在改變癌癥治療,例如免疫檢查點抑制劑 (ICI) 在多種晚期實體癌中的成功匹涮。然而天试,對當前 ICI 的反應率是異質(zhì)的,大多數(shù)實體瘤患者未能獲得長期的臨床益處然低。全面了解腫瘤相關細胞狀態(tài)喜每、它們的相互作用模式以及它們對臨床結(jié)果的影響可以為疾病管理和治療干預提供新的機會。
以前的研究揭示了人類腫瘤的廣泛表型分類雳攘,從 T 細胞發(fā)炎(“hot”)到 T 細胞耗盡(“cold”)的腫瘤带兜。這些分類可以告知疾病特征,包括反應ICI吨灭,但過度簡化了腫瘤微環(huán)境 (TME) 的細胞類型和細胞狀態(tài)刚照。近年來,單細胞基因組學喧兄、空間轉(zhuǎn)錄組學和多重成像已成為直接從原發(fā)組織標本中獲得高分辨率腫瘤細胞生態(tài)系統(tǒng)圖像的強大技術(shù)无畔。然而啊楚,實際考慮在很大程度上將這些測定限制在單一腫瘤類型、中等大小的樣本組或少量表型標志物上浑彰。
在這里恭理,開發(fā)了 EcoTyper,這是一種機器學習框架郭变,用于從大塊組織標本中大規(guī)模描繪細胞狀態(tài)和多細胞群落颜价。我們的方法將統(tǒng)計學習技術(shù)與基因表達反卷積的最新進展相結(jié)合,從bulk诉濒、單細胞和空間分辨的基因表達數(shù)據(jù)中闡明多細胞生態(tài)系統(tǒng)周伦。為了證明該框架的實用性,構(gòu)建了來自 16 種人類癌癥的轉(zhuǎn)錄不同細胞狀態(tài)的全球圖譜循诉。然后横辆,我們定義了近 6,000 個腫瘤的細胞狀態(tài)共現(xiàn)模式,確定了 10 個具有廣泛代表性的多細胞群落茄猫。我們在單細胞水平上描述了我們的發(fā)現(xiàn)狈蚤;在獨立的大塊組織樣本中驗證它們;并研究了它們與基因組特征划纽、總生存期和 ICI 反應的關聯(lián)脆侮。最后,我們query了多細胞群落的空間組織勇劣,包括兩個具有促炎特性的群落靖避。這項工作揭示了人類癌癥中細胞組織的基本單位,對新的診斷和個性化治療有影響比默。
RESULTS
The EcoTyper framework
將 EcoTyper 設計為一個廣泛適用的框架幻捏,用于從原代組織標本中高通量識別細胞狀態(tài)和多細胞群落。它包括三個關鍵步驟:從大塊組織轉(zhuǎn)錄組中數(shù)字純化細胞類型特異性基因表達譜命咐,識別和定量轉(zhuǎn)錄定義的細胞狀態(tài)篡九,以及將細胞狀態(tài)共同分配到多細胞communities中。
EcoTyper 首先應用 CIBERSORTx(一種最近描述的“數(shù)字細胞術(shù)”方法)來確定大塊組織轉(zhuǎn)錄組中單個細胞類型的豐度和基因表達譜(這是bulk解卷積的方法)醋奠。通過估算相關組織樣本集合中主要細胞類型的組成榛臼,CIBERSORTx 可以在數(shù)學上純化多種感興趣細胞類型的基因表達譜,而無需單細胞測序或物理細胞分離窜司。值得注意的是沛善,如果可以從其他來源(例如,單細胞或bulk-sorted的轉(zhuǎn)錄組)獲得特定于細胞類型的表達譜塞祈,則可以省略此步驟金刁。其次,EcoTyper 采用統(tǒng)計學習算法,包括無監(jiān)督和有監(jiān)督的非負矩陣分解 (NMF) 的變體尤蛮,來識別特定細胞類型的轉(zhuǎn)錄程序(“細胞狀態(tài)”)漠秋,量化它們在每個樣本中的相對豐度,以及在外部表達式數(shù)據(jù)集中恢復它們(NMF也是分析的一個重點)抵屿。作為該工作流程的一部分,EcoTyper 實施了一種分析策略捅位,即自適應誤報指數(shù) (AFI)轧葛,以在沒有先驗知識的情況下消除虛假狀態(tài),同時最大限度地提高靈敏度艇搀。第三尿扯,EcoTyper 確定了形成多細胞communities的細胞狀態(tài)之間的共關聯(lián)模式。在這項工作中焰雕,多細胞communities被廣泛定義為跨獨立組織樣本共同出現(xiàn)的細胞狀態(tài)的集合衷笋,與空間鄰域無關。這種狀態(tài)可能參與多種交流模式矩屁,包括依賴接觸的相互作用和通過可擴散分泌分子介導的間接相互作用辟宗。然后,EcoTyper 可以跨數(shù)據(jù)集和平臺查詢細胞狀態(tài)和communities吝秕,從而對組織成分進行大規(guī)模評估泊脐。EcoTyper 的應用包括從新鮮、冷凍或固定的生物樣本中進行表型分析和生物標志物發(fā)現(xiàn)烁峭;通過整合已知的配體-受體對來研究細胞間信號網(wǎng)絡容客;和探索空間轉(zhuǎn)錄組學數(shù)據(jù)中的多細胞communities。
Atlas of transcriptionally defined cell states in 16 carcinomas
為了展示 EcoTyper 的功能约郁,我們使用它來深入了解人類癌癥缩挑、全球癌癥死亡的主要原因以及可公開獲得大量基因組和臨床數(shù)據(jù)的一類惡性腫瘤。由于癌起源于上皮細胞鬓梅,我們首先選擇了 12 種細胞類型供置,它們共同跨越人類上皮腫瘤中發(fā)現(xiàn)的大多數(shù)免疫和結(jié)構(gòu)細胞:B 細胞、漿細胞己肮、CD8 T 細胞士袄、CD4 T 細胞、自然殺傷 (NK) 細胞谎僻、單核細胞/巨噬細胞娄柳、樹突狀細胞、肥大細胞艘绍、中性粒細胞赤拒、成纖維細胞、內(nèi)皮細胞和上皮細胞。然后挎挖,組裝了一組細胞類型特異性基因表達特征这敬,以使用 CIBERSORTx 區(qū)分每種細胞類型。為此蕉朵,利用了之前發(fā)表的基因表達特征崔涂,每個都有廣泛的驗證數(shù)據(jù)支持其對實體瘤(包括癌)去卷積的分析性能。
接下來始衅,探討了關鍵參數(shù)對 EcoTyper 反卷積的影響冷蚂,包括細胞狀態(tài)豐度和細胞狀態(tài)分數(shù)的共線性。我們將 EcoTyper 應用于 500 個模擬腫瘤數(shù)據(jù)汛闸,這些腫瘤由來自非小細胞肺癌 (NSCLC) 個體的單細胞 RNA 測序 (scRNA-seq) 數(shù)據(jù)的混合物構(gòu)成蝙茶。EcoTyper 在一系列輸入分數(shù)(平均值為 0.5%–10%)的 26 個已知細胞狀態(tài)上顯示出強大的反卷積性能,包括細胞狀態(tài)識別(靈敏度 = 0.92诸老,陽性預測值 = 0.86)和枚舉(中位數(shù) Pearson r =已知比例和預測比例之間的 0.93)隆夯。此外,它實現(xiàn)了 ~0.5% 平均分數(shù)豐度的檢測極限别伏,同時還展示了解析具有相關豐度模式的狀態(tài)的能力蹄衷。
接下來,編制了一個發(fā)現(xiàn)隊列厘肮,該隊列由 16 種類型的人類癌癥組成宦芦,跨越 5,946 個腫瘤和 529 個相鄰的正常轉(zhuǎn)錄組,由癌癥基因組圖譜 (TCGA) 分析轴脐。選擇這些數(shù)據(jù)集是為了最大限度地提高樣本處理和處理的一致性调卑、針對正交測量的估算細胞分數(shù)的準確性、管家基因表達水平的一致性大咱,以及每個生物樣本的基因組數(shù)據(jù)和臨床隨訪的可用性恬涧。應用于這些數(shù)據(jù),這些數(shù)據(jù)經(jīng)過統(tǒng)一處理和標準化碴巾,EcoTyper 生成了一個包含 77,700 個數(shù)字純化表達譜的矩陣溯捆,每個評估的細胞類型和患者樣本(即 12 種細胞類型 3 6,475 個樣本)。
該表達矩陣的大小和范圍為識別和驗證癌癥之間共享的腫瘤相關細胞狀態(tài)提供了機會厦瓢。首先提揍,我們通過與來自 scRNA-seq 數(shù)據(jù)的參考圖譜進行比較,確認所有圖譜都顯示出細胞類型特異性的有力證據(jù)煮仇。接下來劳跃,我們應用 EcoTyper 將每個數(shù)字純化樣本建模為離散轉(zhuǎn)錄程序的線性組合。通過這種方式浙垫,純化的樣品被視為bulk-sorted populations,允許每個細胞類型的多個轉(zhuǎn)錄狀態(tài)共存每個樣品刨仑。
在最初的質(zhì)量控制過濾后郑诺,EcoTyper 產(chǎn)生了 71 個離散的細胞狀態(tài),每種細胞類型有 3 到 9 個狀態(tài)杉武。大多數(shù)狀態(tài)在癌癥中普遍存在辙诞,并且在惡性組織中顯著富集,突出了獨立于腫瘤部位的關鍵共性轻抱。然而飞涂,許多狀態(tài)的組織學或臨床分布也各不相同。例如祈搜,多個轉(zhuǎn)錄程序?qū)⒛[瘤與鄰近的正常組織或腺癌與鱗狀細胞癌區(qū)分開來封拧。我們還觀察到細胞譜系和腫瘤類型的根本差異:上皮狀態(tài)對特定腫瘤類型表現(xiàn)出最強的特異性,其次是成纖維細胞夭问、內(nèi)皮細胞、骨髓細胞和淋巴細胞曹铃。
EcoTyper 實現(xiàn)了一個用于參考引導注釋的監(jiān)督框架缰趋,其中在一個數(shù)據(jù)集中學習的細胞狀態(tài)可以在另一個數(shù)據(jù)集中進行識別和統(tǒng)計評估。為了評估 EcoTyper 定義的 71 種細胞狀態(tài)的真實性陕见,我們query了 200,000 個單細胞轉(zhuǎn)錄組中每種狀態(tài)的存在情況秘血,這些轉(zhuǎn)錄組涵蓋四種類型的人類癌癥:乳腺癌 (BRCA)、結(jié)直腸癌 (CRC)评甜、頭頸部鱗狀細胞癌癌(HNSCC)和非小細胞肺癌。總之墩邀,94% 的細胞狀態(tài)(71 個中的 67 個)在 scRNA-seq 數(shù)據(jù)中使用參考引導注釋和排列測試可顯著恢復深胳。無論平臺、細胞類型或數(shù)據(jù)集如何佩研,回收率都保持很高柑肴,這突顯了我們結(jié)果的穩(wěn)健性。此外旬薯,我們在所有 7 個 scRNA-seq 腫瘤圖譜中觀察到顯著可重復的標記基因表達晰骑,留一法交叉驗證率為 90%“硇颍基于這些評估硕舆,選擇了 71 個狀態(tài)中的 69 個進行進一步分析,省略了映射到 scRNA-seq 數(shù)據(jù)中潛在雙細胞的 2 個(內(nèi)皮細胞狀態(tài) 3骤公,成纖維細胞狀態(tài) 7)抚官。
作為另一種驗證方法,還測試了是否在單細胞水平上概括了富含特定生物分組(例如正常組織)的狀態(tài)阶捆。事實上耗式,在將單細胞轉(zhuǎn)錄組映射到 EcoTyper 狀態(tài)后,觀察到在鄰近正常組織、腺癌或鱗狀細胞癌中富集的狀態(tài)具有顯著的一致性刊咳。此外彪见,與其他用于監(jiān)督 scRNAseq 分類的參考引導注釋工具相比,EcoTyper 表現(xiàn)出卓越的性能娱挨。
接下來余指,通過與已知的轉(zhuǎn)錄程序、顯著表達的標記基因和之前的 scRNA-seq 研究定義的狀態(tài)進行比較來注釋每個狀態(tài)跷坝。大約三分之二的 EcoTyper 狀態(tài)可歸因于先前文獻中建立的基因或表型酵镜。例如,在沒有先驗知識的情況下柴钻,EcoTyper 鑒定了與腫瘤新血管形成有關的 ANGPTL2+/NID2+ 尖端樣內(nèi)皮細胞淮韭;先前在 HNSCC 中描述的兩種成纖維細胞狀態(tài);具有部分 EMT 特征的上皮細胞亞群(狀態(tài) 3)贴届;和與前效應靠粪、衰竭和靜息表型相關的典型 T 細胞亞群(分別為 CCR7+、LAG3+毫蚓、KLF2+)占键。 EcoTyper 還揭示了對癌癥可塑性知之甚少的細胞類型的見解。例如元潘,在癌癥免疫治療中具有新興作用的單核細胞/巨噬細胞譜系細胞中畔乙,EcoTyper 重建了九種具有廣泛代表性的體內(nèi)表型,包括與促炎單核細胞 (CCR2+)翩概、經(jīng)典 M0 巨噬細胞 (FABP4+) 和M1 巨噬細胞 (CXCL9+)牲距。還可以檢測到四種候選的 M2 樣巨噬細胞亞型(狀態(tài) 4-7),包括表達已知 M2 標記基因的狀態(tài)钥庇,例如 CD209 和 CD163(狀態(tài) 4)嗅虏、S1PR1(狀態(tài) 5)和 CHI3L2(狀態(tài) 7)。
重要的是上沐,近三分之一的 EcoTyper 狀態(tài)似乎是新的皮服,或者以前沒有通過人類癌癥的 scRNA-seq 調(diào)查發(fā)現(xiàn)。例如参咙,在 M2 樣巨噬細胞中龄广,確定了與foamy巨噬細胞顯著相似的 AEBP1+ 群體(狀態(tài) 6),foamy巨噬細胞是一種經(jīng)常與動脈粥樣硬化斑塊相關的富含脂質(zhì)的表型蕴侧,但其在癌癥中的相關性尚不清楚择同。為了證實這種狀態(tài),我們對從福爾馬林固定石蠟包埋的人體內(nèi)分離的基質(zhì)細胞進行了bulk RNA 序列分析净宵∏貌牛基于 H&E 染色的具有高和低foamy巨噬細胞含量的 CRC 腫瘤活檢裹纳。事實上,在 EcoTyper 鑒定的九個單核細胞/巨噬細胞狀態(tài)中紧武,狀態(tài) 6 獨特地富含富含foamy巨噬細胞的基質(zhì)剃氧,支持分析的結(jié)果。
總的來說阻星,這些分析證明了 EcoTyper 的性能朋鞍,并強調(diào)了其在當前超出其他技術(shù)實際限制的規(guī)模上定義細胞類型特異性轉(zhuǎn)錄程序的價值。補充提供了所有已識別狀態(tài)的詳細描述妥箕,包括轉(zhuǎn)錄因子滥酥、候選表面標記和 scRNA-seq 恢復統(tǒng)計。
Global view of cell-state prognostic associations
我們和其他人之前已經(jīng)表明畦幢,來自外部來源的細胞類型特異性參考資料坎吻,包括bulk-sorted populations和 scRNA-seq 數(shù)據(jù),可以預測癌癥臨床結(jié)果宇葱。然而瘦真,人類癌癥中環(huán)境依賴性細胞狀態(tài)的預后影響在很大程度上是未知的。因此贝搁,我們利用 EcoTyper 的獨特輸出來繪制 15,008 個腫瘤中 69 個細胞狀態(tài)的預后圖。
在我們的發(fā)現(xiàn)隊列調(diào)查的 16 種上皮癌類型中芽偏,大多數(shù)細胞狀態(tài)(69 種中的 39 種)與總生存期顯著相關雷逆,49% (n = 34) 在包含階段、年齡和性別的多變量分析中具有顯著性污尉。全球生存協(xié)會將幾乎所有評估的細胞類型分為有利和不利狀態(tài)膀哲,突出它們的生物學和臨床異質(zhì)性。例如被碗,如先前研究中發(fā)現(xiàn)的某宪,注釋為 M1(狀態(tài) 3)和 M2(狀態(tài) 4-7)的巨噬細胞亞群分別與更長和更短的存活時間相關。令人驚訝的是锐朴,在 M2 樣狀態(tài)中兴喂,AEBP1+ foamy巨噬細胞是不良生存的前五名決定因素之一,這表明foamy細胞作為癌癥的免疫治療靶點可能具有廣泛的相關性焚志。其他與不良風險相關的顯著狀態(tài)包括 CA9+ 成纖維細胞(狀態(tài) 8)和 POSTN+ 成纖維細胞(狀態(tài) 3)衣迷,這兩種細胞都與腫瘤侵襲性有關,以及促血管生成尖端樣內(nèi)皮細胞(狀態(tài) 2)酱酬。特定的白細胞群體在癌癥中占主導地位壶谒,主要狀態(tài)包括 CCR7+ 幼稚/中央記憶 CD4+ T 細胞、CD247+ NK 細胞膳沽、CD27+ 漿細胞和 XCR1+ cDC1 樣樹突狀細胞汗菜,它們與 CD8+ T 細胞啟動有關让禀。
為了確定這些結(jié)果的普遍性,應用 EcoTyper 對通過微陣列分析的 9,062 個上皮腫瘤轉(zhuǎn)錄組的獨立隊列中的所有 69 種細胞狀態(tài)進行定量(PRECOG)陨界,可獲得總生存期數(shù)據(jù)巡揍。首先,我們確認 EcoTyper 對bulk RNA-seq 和微陣列之間的平臺特定變化具有魯棒性普碎。接下來吼肥,計算了 PRECOG 數(shù)據(jù)庫中特定狀態(tài)的生存關聯(lián),通過加權(quán) Z 分數(shù)來衡量麻车。值得注意的是缀皱,TCGA 和 PRECOG 之間的生存關聯(lián)高度一致(Pearson r = 0.73,p = 1.2 * 10-12)动猬,證實了我們的發(fā)現(xiàn)并強調(diào)了 EcoTyper 對新數(shù)據(jù)集的可擴展性啤斗。我們還觀察到個體腫瘤類型的高度一致性,例如結(jié)腸癌赁咙、卵巢癌和胃癌钮莲,其中 M1 和 M2 foamy樣巨噬細胞分別預測更長和更短的存活時間。
Large-scale reconstruction of multicellular communities in vivo
腫瘤是由空間和時間相關的細胞狀態(tài)組成的復雜生態(tài)系統(tǒng)彼水。為了確定 EcoTyper 是否可以重建多細胞生態(tài)系統(tǒng)崔拥,我們設計了一個數(shù)據(jù)驅(qū)動的基于共現(xiàn)和相互避免的模式對細胞狀態(tài)進行聚類的方法。通過將這種方法應用于發(fā)現(xiàn)隊列中的腫瘤樣本(69 個states凤覆,5946 個腫瘤)链瓦,我們確定了 10 個具有顯著凝聚力的細胞群落,我們將其稱為“癌生態(tài)型”(CEs)盯桦。CE 的范圍從每個社區(qū) 3 到 9 個不同的細胞狀態(tài)慈俯,獨立于聚類方法而被穩(wěn)健地恢復,在人類癌癥中普遍存在拥峦,并且與 TCGA 中最近描述的免疫亞型高度不同贴膘。可以連續(xù)評估略号。雖然幾乎每個腫瘤樣本都有一個占主導地位的 CE刑峡,但大多數(shù)腫瘤由多個 CE 組成,突出了腫瘤組織組成的模塊化玄柠。
為了驗證這些結(jié)果氛琢,我們進行了三個技術(shù)實驗。首先随闪,我們測試了 CE 是否可跨平臺和獨立數(shù)據(jù)集重現(xiàn)阳似。事實上,在通過 RNA-seq 和微陣列分析的 395 個人類癌癥樣本中铐伴,估計的 CE 水平在平臺之間顯著相關撮奏。此外俏讹,通過使用 UMAP 對細胞狀態(tài)豐度分布進行降維,我們在超過 6,000 個保留的上皮腫瘤中觀察到幾乎相同的群落結(jié)構(gòu)畜吊。其次泽疆,我們測試了 CE 是否富含具有相互作用潛力的細胞狀態(tài),無論是在生態(tài)型內(nèi)部還是跨生態(tài)型玲献。與背景預期相比殉疼,60% 的 CE 在配體-受體對中顯著富集,多個 CE 對也顯示出生態(tài)型間相互作用的證據(jù)捌年。
鑒于這些結(jié)果瓢娜,我們接下來query是否可以在單細胞數(shù)據(jù)中檢測到十個 CE。使用上述 scRNA-seq 礼预,其中包括 ~200,000 個單細胞轉(zhuǎn)錄組眠砾,包括 76 個腫瘤和 21 個來自四種癌的相鄰正常標本,我們將單個細胞分配到 EcoTyper 狀態(tài)托酸。然后褒颈,確定了每個腫瘤/正常樣本中每個狀態(tài)的豐度分數(shù),隨后將細胞狀態(tài)分組到由 EcoTyper 定義的相同 CE 類別中励堡。最后谷丸,確定了分配給同一 CE 的狀態(tài)是否比隨機機會預期的更緊密。總之应结,80% 的 CE 在 scRNA-seq 數(shù)據(jù)中可顯著檢測到刨疼,p < 0.05。此外摊趾,在 p < 0.06 時可檢測到 90%币狠。鑒于 scRNA-seq 數(shù)據(jù)中可能掩蓋 CE 檢測的潛在混雜因素游两,包括適度的樣本量砾层、每個樣本的低細胞數(shù)、基因表達的稀疏性和解離引起的扭曲贱案,這一結(jié)果令人震驚肛炮。作為一種替代方法,我們確定了通過隨機機會獲得十個具有同樣強聯(lián)合關聯(lián)的 CE 的聯(lián)合概率宝踪。相對于背景預期侨糟,通過隨機機會獲得原始結(jié)果的概率小于 1,000,000 分之一 (p < 10-6)。
總之瘩燥,這些數(shù)據(jù)驗證了我們的方法秕重,在bulk和單細胞表達數(shù)據(jù)中識別出不同的多細胞群落,并將 CE 指定為人類癌癥細胞組織的基本單位厉膀。(非常重要)
6,000 個正常和腫瘤組織標本的癌生態(tài)型特征
在確定了癌癥中的十個主要多細胞生態(tài)系統(tǒng)后溶耘,接下來探索了它們的細胞二拐、基因組和臨床特征。在整個發(fā)現(xiàn)隊列中凳兵,8 個 CE 在單變量模型中具有顯著的預后意義百新,5 個在對階段、年齡和性別進行多變量調(diào)整后仍然顯著庐扫。 CE1 和 CE2 高的腫瘤缺乏淋巴細胞饭望,與較高的死亡風險密切相關,并且分別通過 POSTN+ 成纖維細胞和基底樣上皮細胞水平升高來廣泛區(qū)分形庭。 CE3 高的腫瘤铅辞,預示著較差的生存結(jié)果,富含骨髓碘勉,微衛(wèi)星不穩(wěn)定性 (MSI) 高巷挥,并與 COSMIC 突變過程相關 17,這是在包括食管癌和胃癌在內(nèi)的多種腫瘤類型中發(fā)現(xiàn)的特征验靡,至少與部分原因是胃反流倍宾。 CE4 高腫瘤與肌肉生成和 60 歲以上的男性相關(部分原因是其在 HNSCC 和前列腺癌中的患病率較高),而 CE5 至 CE8 高腫瘤富含與吸煙相關的突變胜嗓、正常組織高职、年齡相關的突變和適度有利的結(jié)果,分別辞州。最后怔锌,CE9 和 CE10 高的腫瘤是促炎性的(即富含白細胞),與更長的總生存期密切相關变过,并且分別具有更高的免疫反應性埃元,包括 IFN-g 信號傳導和更高的 B 細胞含量。值得注意的是媚狰,兩個 CE 在腫瘤和鄰近正常組織中以相似的頻率存在岛杀,但在健康組織中耗盡(CE4、CE10)崭孤,反映了潛在的場效應类嗤。除 CE6 外,其他主要針對腫瘤組織辨宠。
總生存期和免疫治療反應的多細胞預測
由于每種癌癥生態(tài)型都整合了來自多種細胞狀態(tài)的貢獻遗锣,我們推斷 CE 分析可能具有改善臨床結(jié)果預測的潛力。為了測試這種可能性嗤形,我們首先將 CE 與用于預測發(fā)現(xiàn)隊列中的總體存活率的兩種分子亞型方案進行了比較:bulk NMF 聚類和由 TCGA 定義的六種泛癌免疫亞型的集合精偿。選擇前者來評估 EcoTyper 反卷積的優(yōu)點,而選擇后者作為 TME 分類的比較器。雖然bulk NMF 亞型主要局限于上皮細胞的異質(zhì)性笔咽,但泛免疫亞型顯示出相對適度的預后關聯(lián)墓阀。相比之下,CE 在我們進行的所有比較分析中顯示出明顯的優(yōu)勢拓轻,無論是在 CE 特異性生存關聯(lián)方面斯撮,還是在針對大量 NMF 和泛免疫亞型調(diào)整的多變量生存模型中。
接下來扶叉,我們query CE 是否可以預測免疫治療反應勿锅。為此,收集了 571 名晚期轉(zhuǎn)移性疾病患者在接受抗 PDL1(尿路上皮癌)枣氧、抗 PD1(黑色素瘤)或抗 CTLA4(黑色素瘤)單一療法的免疫檢查點阻斷之前的腫瘤表達數(shù)據(jù)溢十。我們在該分析中包括了轉(zhuǎn)移性黑色素瘤,因為大多數(shù)非上皮細胞狀態(tài)可靠地概括為這種疾病达吞。為了量化性能张弛,我們評估了與總生存期的連續(xù)關聯(lián)以及與免疫治療反應的二元關聯(lián)。 CE9 以 IFN-g 信號為特征酪劫,在預測各種治療類型和結(jié)果測量的卓越結(jié)果方面優(yōu)于其他 CE吞鸭。我們還將 CE 分析與 112 個候選生物標志物進行了比較,包括由 EcoTyper 定量的 69 個細胞狀態(tài)覆糟、由 CIBERSORTx 枚舉的 25 個親本群體刻剥、腫瘤突變負荷 (TMB) 和 2 個已發(fā)表的 ICI 反應的bulk特征。令人驚訝的是滩字,CE9 豐度超過了所有其他指標造虏,包括那些受過訓練以預測 ICI 反應的指標。這些數(shù)據(jù)一起表明麦箍,即使沒有優(yōu)化漓藕,多細胞群落也可以捕獲具有卓越預測價值的生物信號。
Spatiotemporal dynamics of proinflammatory communities
接下來試圖確定癌癥生態(tài)型是否顯示出不同的空間組織模式挟裂。為此享钞,我們主要關注 CE9 和 CE10,這兩個促炎群落具有典型的 T 細胞狀態(tài)和良好的總體存活率话瞧,但基因組和細胞特征不同嫩与。 CE9-T 細胞狀態(tài)表達激活和免疫調(diào)節(jié)基因寝姿,包括衰竭標志物交排,這與 CE9 與 ICI 反應的關聯(lián)一致(例如,CD8 T 細胞 S3 中的 LAG3 和 CD4 T 細胞 S1 中的 CTLA4)饵筑。相反埃篓,CE10-T 細胞表達幼稚和中央記憶細胞的標志物(例如,CCR7)根资。盡管這種差異在腫瘤相關 T 細胞中得到了很好的證明架专,但它們的精確細胞群落以前尚未建立同窘。使用 EcoTyper,我們發(fā)現(xiàn) CE9-T 細胞與六種細胞狀態(tài)強烈共存部脚,包括類似于 M1 巨噬細胞想邦、成熟的免疫原性樹突狀細胞和活化的 B 細胞的狀態(tài)。相反委刘,CE10-T 細胞與五種細胞狀態(tài)共存丧没,包括與促炎單核細胞、cDC1 樹突狀細胞和幼稚/靜息 B 細胞一致的細胞狀態(tài)锡移。這些結(jié)果通過參考指導注釋在七個 scRNA-seq 數(shù)據(jù)集中得到證實呕童,加強了認為特定表型優(yōu)先在腫瘤微環(huán)境中作為多細胞組裝同時出現(xiàn)。
為了檢查 CE 特異性表型是否在空間上不同淆珊,我們首先對分別標記 CE9 和 CE10-T 細胞的 GZMB 和 GZMK 進行了多色免疫熒光 (IF) 染色夺饲。在癌癥中,已觀察到 GZMB 和 GZMK 分別區(qū)分激活的效應記憶 T 細胞和過渡效應記憶 T 細胞施符。我們將 EcoTyper 應用于 NSCLC 患者的 23 個大塊腫瘤轉(zhuǎn)錄組往声,并選擇了四個具有不同 CE9 和 CE10 組成的樣本。這些標本的多重染色驗證了 EcoTyper 的預測戳吝。此外烁挟,雖然 GZMB+ T 細胞定位于腫瘤核心,這與慢性抗原刺激和 T 細胞耗竭之間的聯(lián)系一致骨坑,但 GZMK+ T 細胞在很大程度上被排除在外撼嗓,而是定位于外周。
為了將我們的分析擴展到 T 細胞之外欢唾,我們進一步將 IF 成像應用于 APOE+/CD68+ 和 CCR2+/CD68+ 細胞且警,它們分別標記巨噬細胞/單核細胞譜系中的 CE9 和 CE10 富集狀態(tài)。使用來自上述分析的腫瘤標本礁遣,我們證實了由 IF 確定的相對細胞狀態(tài)豐度與由 EcoTyper 確定的那些一致斑芜。正如對 T 細胞所觀察到的,APOE+/CD68+ 細胞定位于腫瘤核心祟霍,而 CCR2+/CD68+ 細胞定位于外周杏头。無論我們分析的是單個細胞狀態(tài)還是整個細胞群落,這些發(fā)現(xiàn)都與通過原位空間條形碼微陣列數(shù)據(jù) (10x Visium) 分析的人類乳腺癌樣本的 EcoTyper 去卷積一致沸呐。此外醇王,生態(tài)型之間的空間差異在與腫瘤細胞的距離方面非常顯著,這一發(fā)現(xiàn)可擴展到黑色素瘤標本崭添。
為了確定其他細胞類型和癌癥是否顯示出 CE 特異性共定位模式的證據(jù)寓娩,我們接下來探索了通過空間轉(zhuǎn)錄組學分析的乳腺癌、結(jié)腸直腸癌、卵巢癌和黑色素瘤樣本中的細胞狀態(tài)共關聯(lián)棘伴。我們發(fā)現(xiàn)寞埠,無論發(fā)育譜系或癌癥類型如何,細胞狀態(tài)通常都以 CE 特異性方式共定位焊夸。通過目視檢查仁连,這些圖案也很明顯。為了量化 CE 空間組織阱穗,我們應用了 Moran's I怖糊,一種空間自相關的統(tǒng)計量度。我們發(fā)現(xiàn)一些 CE 在空間上高度聚合(CE1颇象、CE9伍伤、CE10),而另一些則更加分散(CE4遣钳、CE5扰魂、CE3)。然而蕴茴,近三分之二的 CE 在空間上富含發(fā)現(xiàn)隊列中鑒定的 CE 特異性配體-受體對劝评,這意味著大多數(shù) CE,包括 CE9 和 CE10倦淀,都發(fā)生在具有增強相互作用潛力的空間不同的細胞鄰域中蒋畜。
鑒于這些結(jié)果,再加上觀察到 CE10 通常比 CE9 更遠離腫瘤核心并且也存在于鄰近的正常組織中撞叽,我們假設 CE10 在早期腫瘤發(fā)展過程中先于 CE9姻成。與此一致,我們發(fā)現(xiàn)在鱗狀細胞肺癌發(fā)生的早期階段愿棋,CE10 比 CE9 更普遍科展,而在惡性組織中,CE9 比 CE10 更普遍糠雨。此外才睹,在從 33 名已知結(jié)果的受試者收集的肺鱗狀細胞癌癌前病變中,CE10 的較高相對水平與自發(fā)消退顯著相關甘邀,而 CE9 的較高相對水平預測進展為浸潤性癌(曲線下面積 = 0.82)琅攘。這些數(shù)據(jù)共同進一步驗證了我們的方法,將 CE 動力學與早期肺癌發(fā)展聯(lián)系起來松邪,并提供了一個平臺來系統(tǒng)地詢問腫瘤細胞生態(tài)系統(tǒng)的診斷和治療潛力坞琴。
DISCUSSION
在這項研究中,描述了 EcoTyper测摔,這是一個從基因表達數(shù)據(jù)中解碼細胞狀態(tài)和多細胞群落的集成系統(tǒng)置济。EcoTyper 在幾個重要方面與相關技術(shù)不同:首先,通過直接從完整組織活檢的 RNA 譜中估算細胞異質(zhì)性锋八,EcoTyper 避免了物理細胞分離引起的扭曲浙于;不需要抗體或表型標記的預選;適用于新鮮挟纱、冷凍和固定標本羞酗。其次,與以前的反卷積方法不同紊服,EcoTyper 可以準確地解析來自多種細胞類型 (>10) 的轉(zhuǎn)錄狀態(tài)檀轨,將它們組裝成多細胞群落,量化它們的相對組成欺嗤,并在不同的表達數(shù)據(jù)集和平臺上查詢它們参萄。盡管在這項工作中將 EcoTyper 應用于 16 種癌癥,但它可推廣到任何有合適表達數(shù)據(jù)的組織類型和疾病狀態(tài)煎饼。
雖然最近的研究揭示了使用多重成像對腫瘤細胞群落的重要見解讹挎,但這些研究集中在使用有限數(shù)量的預定義表型標志物的單一腫瘤類型上。通過部署 EcoTyper 來分析跨越近 6,000 個大塊腫瘤轉(zhuǎn)錄組的 16 種人類癌癥吆玖,我們以與標記無關的方式發(fā)現(xiàn)了 69 個轉(zhuǎn)錄定義的細胞狀態(tài)和 10 個以前未知的多細胞群落筒溃。為此,我們在數(shù)千個實體瘤的轉(zhuǎn)錄水平上對多細胞群落進行了表征沾乘,在 scRNA-seq 數(shù)據(jù)中證實了它們怜奖,并評估了它們與 ICI 反應和早期癌癥發(fā)展的關聯(lián)。這些數(shù)據(jù)和相關分析工具為開發(fā)依賴于腫瘤相關細胞狀態(tài)及其多細胞相互作用模式的診斷和治療策略提供了新的機會翅阵。
In summary, we demonstrate how cell states and multicellular communities can be profiled from bulk tissue transcriptomes, recovered in expression datasets independent of platform,related to immunotherapy response, and tracked across space and developmental time. Our approach is accurate, is complementary to existing single-cell assays, and has significant potential for generating experimentally testable hypotheses. Given its unique capabilities, we anticipate that EcoTyper will prove useful for reconstructing cellular community structure at high resolution and massive scale in health and disease.
Method
Overview of in silico purification
Signature matrix design
Cell state discovery
Cell state and ecotype recovery
我們利用 NMF 模型的內(nèi)部結(jié)構(gòu)設計了一種基于參考的策略來恢復新樣本中的細胞狀態(tài)歪玲。
Significance of cell state recovery
Limit of detection and collinearity analyses
scRNA-seq tumor atlases
Enrichment of cell states in known phenotypes
Comparison of scRNA-seq annotation methods
State-specific marker genes in scRNA-seq data
Ligand-receptor enrichment analysis
Analysis of spatial transcriptomics data
純方法論的文章,非常難掷匠,我們下一篇分享示例代碼
生活很好读慎,有你更好