單細(xì)胞轉(zhuǎn)錄組探索頭頸癌癥的轉(zhuǎn)移癌和原位癌區(qū)別
文章發(fā)表于2017年12月陕贮,在CELL雜志:Single-Cell Transcriptomic Analysis of Primary and Metastatic Tumor Ecosystems in Head and Neck Cancer 測序如下;
We profiled transcriptomes of ~6,000 single cells from 18 head and neck squamous cell carcinoma (HNSCC) patients, including five matched pairs of primary tumors and lymph node metastases.
同時(shí)也對(duì)這些病人測了whole-exome sequencing (WES) and targeted genotyping (SNaPshot) data,但是這些數(shù)據(jù)公布在 phs001474.v1.p1
政溃,不是很方便下載。
單細(xì)胞轉(zhuǎn)錄組建庫用的Smart-seq2
方法态秧,所有的數(shù)據(jù)公布在 GSE103322 董虱, 僅僅是表達(dá)矩陣都有近100Mb了。
GSE103322_HNSCC_all_data.txt.gz | 86.0 Mb |
實(shí)驗(yàn)驗(yàn)證用的是細(xì)胞系 Oral cavity HNSCC cell lines (Cal-27, SCC9, SCC4, SCC25, and JHU-006; all derived from male patients) 做了RNA-seq 數(shù)據(jù)申鱼。
腫瘤內(nèi)異質(zhì)性是腫瘤學(xué)的主要挑戰(zhàn)愤诱。在新興的技術(shù)中,scRNA-seq有助于確定與腫瘤生物學(xué)捐友,診斷和治療有關(guān)的發(fā)育等級(jí)淫半,抗藥性程序和免疫滲透模式。在這里匣砖,研究者應(yīng)用這種方法來表征原發(fā)性HNSCC腫瘤和匹配的LN轉(zhuǎn)移瘤科吭。
名詞介紹
頭頸部鱗狀細(xì)胞癌(HNSCC)
淋巴結(jié)轉(zhuǎn)移(LN)
癌癥基因組圖譜(TCGA)
癌相關(guān)成纖維細(xì)胞(CAF)
細(xì)胞外基質(zhì)(ECM)
循環(huán)腫瘤細(xì)胞(CTC)
單細(xì)胞RNA測序(scRNAseq)
腫瘤微環(huán)境(TME)
全外顯子組測序(WES)和靶向基因分型(SNaPshot)
Epithelial-to-mesenchymal transition (EMT)
PNI = perineural invasion; LVI = lymphovascular invasion; ECE = extracapsular extension
?
背景介紹
HNSCC 頭頸癌是最常見的十大癌癥之一,每年有50萬患者深受其害脆粥,其中砌溺,超過80%的患者為口腔鱗狀細(xì)胞癌(OSCC)。盡管目前有手術(shù)变隔、化療、放療等治療手段蟹倾,但5年存活率僅有50%匣缘,仍是存活率最低的癌癥之一猖闪,且近30年沒有改善。所以探尋新的治療方式抑制OSCC生長和轉(zhuǎn)移尤為重要肌厨。
頭頸部鱗狀細(xì)胞癌(HNSCC)是一種與酒精和煙草暴露密切相關(guān)的具有異質(zhì)性的上皮腫瘤培慌,患者往往在晚期出現(xiàn)的淋巴結(jié)轉(zhuǎn)移(LN)。
單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)分析CNV跟WES的對(duì)比
首先把所有病人的近6000個(gè)細(xì)胞根據(jù)表達(dá)模式區(qū)分成惡性與否柑爸,分成兩組進(jìn)行CNV聚類吵护,可以看到惡性細(xì)胞的CNV模式跟從WES數(shù)據(jù)分析得到的CNV模式比較類似,說明了單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)分析CNV是靠譜的表鳍。當(dāng)然馅而,本身該課題組前面的幾篇文章就提到了這個(gè)方法以及證實(shí)了其可靠性。
病人MEEI5的CNV情況
MEEI5 是一個(gè)69歲的女性譬圣,對(duì)來源于她的所有單細(xì)胞的轉(zhuǎn)錄組數(shù)據(jù)分析得到的CNV信息進(jìn)行聚類可以看到比較清晰的patter瓮恭,其中惡性與否比較容易區(qū)分,而且對(duì)于惡性細(xì)胞也可以看出原位癌和轉(zhuǎn)移癌的區(qū)別厘熟。
首先區(qū)分腫瘤細(xì)胞的惡性與否
用Smart-seq2
建庫方法得到的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)經(jīng)過QC后屯蹦,留下了來自18名患者的5,902個(gè)細(xì)胞,首先可以分成2215個(gè)惡性細(xì)胞和3363個(gè)非惡性細(xì)胞绳姨。
首先登澜,研究者根據(jù)跨染色體間隔的平均表達(dá)譜推斷每個(gè)單細(xì)胞中的大規(guī)模染色體拷貝數(shù)變異(CNV)。這些推斷的CNVs與WES一致飘庄,通過推斷的CNVs將惡性細(xì)胞從正常核型的非惡性細(xì)胞中分離出來脑蠕。
其次,研究者通過其上皮來源鑒別惡性細(xì)胞竭宰,其不同于TME中的基質(zhì)和免疫細(xì)胞空郊。研究者發(fā)現(xiàn)在具有上皮標(biāo)志物表達(dá)的細(xì)胞和具有異常核型的細(xì)胞之間具有顯著的一致性。
最后切揭,研究者通過它們的全局表達(dá)模式將細(xì)胞劃分到初始類狞甚。基于CNV和上皮標(biāo)志物分析,絕大多數(shù)細(xì)胞均被分到具有一致惡性或非惡性分類類中去廓旬。
非惡性細(xì)胞的聚類沒有個(gè)體差異
如果只對(duì)已經(jīng)被區(qū)分出來的三千多個(gè)非惡性腫瘤細(xì)胞
進(jìn)行聚類哼审,采取SC3算法,效果如下圖孕豹,雖然有14個(gè)類別涩盾,但是根據(jù)已知標(biāo)記基因的表達(dá),可以注釋為B細(xì)胞励背,巨噬細(xì)胞春霍,樹突狀細(xì)胞,肥大細(xì)胞叶眉,內(nèi)皮細(xì)胞址儒,成纖維細(xì)胞和肌細(xì)胞這八個(gè)值得探究的類別芹枷。
值得注意的是,每個(gè)類含有來自不同患者的細(xì)胞莲趣,表明TME(這三千多個(gè)非惡性細(xì)胞就是腫瘤微環(huán)境)中的細(xì)胞類型和表達(dá)狀態(tài)在HNSCC腫瘤中基本一致鸳慈,并且沒有患者特異性亞群或批處理效應(yīng),盡管它們的比例是不同的喧伞。
而且由于研究者的數(shù)據(jù)集中T細(xì)胞和成纖維細(xì)胞走芋,即數(shù)量相對(duì)較多,研究者通過更精確的聚類發(fā)現(xiàn)了T細(xì)胞和成纖維細(xì)胞的多樣性潘鲫。如下:
單獨(dú)查看成纖維細(xì)胞CAF
rv1,500成纖維細(xì)胞分成兩個(gè)大類翁逞,一個(gè)小類別。
- 第一個(gè)類表達(dá)肌成纖維細(xì)胞的經(jīng)典標(biāo)記次舌,包括α平滑肌肌動(dòng)蛋白(ACTA2)和肌球蛋白輕鏈蛋白(MYLK熄攘,MYL9)。肌成纖維細(xì)胞是TME的成熟組分彼念,并與傷口愈合和攣縮有關(guān)挪圾。
- 第二個(gè)類表達(dá)與癌相關(guān)成纖維細(xì)胞(CAF)相關(guān)的受體,配體和細(xì)胞外基質(zhì)(ECM)基因逐沙,包括成纖維細(xì)胞活化蛋白(FAP)哲思,podoplanin(PDPN)和結(jié)締組織生長因子(CTGF)。
- 第三個(gè)類基本不包括肌成纖維細(xì)胞和CAF的標(biāo)記物吩案,并可能代表處于靜止?fàn)顟B(tài)的成纖維細(xì)胞棚赔。
其中還可以把CAFs(第二個(gè)類)分為具有立即早期應(yīng)答基因(例如JUN,F(xiàn)OS)徘郭,間充質(zhì)標(biāo)志物(例如VIM靠益,THY1),配體和受體(例如FGF7)差異表達(dá)的兩種類型(CAF1和CAF2)残揉,TGFBR2 / 3)和ECM蛋白質(zhì)(例如MMP11胧后,CAV1)。這種瘤內(nèi)CAF異質(zhì)性與TMF中涉及復(fù)雜結(jié)構(gòu)和旁分泌相互作用的觀點(diǎn)一致抱环。
單獨(dú)查看T細(xì)胞
主要T細(xì)胞類(rv1000個(gè)T細(xì)胞)可以分為四個(gè)亞群壳快,研究者注釋為
- 調(diào)節(jié)性T細(xì)胞(Treg)
- 常規(guī)CD4 + T輔助細(xì)胞(CD4 + Tconv)
- 兩種細(xì)胞毒性CD8 + T細(xì)胞群(CD8 + T和CD8 + Texhausted)
細(xì)胞毒素亞型在共抑制性受體(例如PD1,CTLA4)和與T細(xì)胞功能障礙和衰竭相關(guān)的其他基因的表達(dá)方面不同镇草,并由此定義HNSCC中推定的T細(xì)胞耗竭程序眶痰。耗竭CD8 + T細(xì)胞的部分在研究者的隊(duì)列患者中顯著變化。這些T細(xì)胞表達(dá)狀態(tài)可以為理解和預(yù)測檢查點(diǎn)免疫療法的反應(yīng)提供幫助梯啤。
惡性細(xì)胞聚類完全取決于患者個(gè)體
與非惡性細(xì)胞相比竖伯,2215惡性細(xì)胞根據(jù)其起源的腫瘤聚類。超過2000個(gè)基因優(yōu)先在個(gè)體腫瘤中表達(dá)因宇。
差異表達(dá)的基因在腫瘤之間不同的CNV內(nèi)富集黔夭。
最后宏胯,其他差異表達(dá)的基因與應(yīng)激(例如JUNB羽嫡,F(xiàn)OSL1)或免疫激活(例如IDO1本姥,STAT1,TNF)有關(guān)杭棵,可能對(duì)不同的TME有反應(yīng)婚惫。因此,腫瘤間惡性細(xì)胞表達(dá)異質(zhì)性反映了研究者隊(duì)列中腫瘤之間遺傳學(xué)魂爪,亞型和TME的差異先舷。
惡性細(xì)胞的基因特征
這里重點(diǎn)分析那些含有惡性細(xì)胞轉(zhuǎn)錄組最多數(shù)量的10對(duì)腫瘤樣本。比如下面的病人MEEI25滓侍,一個(gè)76歲的女性:
研究者使用非負(fù)矩陣分解來揭示在惡性細(xì)胞亞群中得到優(yōu)先共同表達(dá)的一系列基因蒋川。例如,對(duì)于MEEI25惡性細(xì)胞撩笆,研究者定義了6個(gè)不同的基因特征捺球。對(duì)10個(gè)腫瘤樣本中的每一個(gè)都應(yīng)用該方法,共定義了60個(gè)基因特征夕冲。
接下來氮兵,研究者使用層次聚類來將這些60個(gè)特征提取成元特征,這些元特征反映了在多個(gè)腫瘤內(nèi)變化的常見表達(dá)程序歹鱼。來自不同腫瘤的特征之間的高一致性表明它們反映了腫瘤內(nèi)表達(dá)異質(zhì)性的共同模式泣栈。
LN轉(zhuǎn)移與原發(fā)性腫瘤比較
研究者將LN轉(zhuǎn)移與原發(fā)性腫瘤(只有5個(gè)病人是取了配對(duì)樣本)進(jìn)行了比較。盡管WES和推測的CNV顯示了原發(fā)性和匹配的LN樣本之間的存在一些基因組差異弥姻,但是可能是由于所研究的個(gè)體數(shù)量較少南片,他們沒有鑒別出任何一致的區(qū)別。
LN中惡性細(xì)胞的表達(dá)譜也與相應(yīng)的原發(fā)腫瘤大致匹配庭敦。在每個(gè)配對(duì)樣本中疼进,都有較少的差異表達(dá)基因是顯著差異的,但是它們在整個(gè)群體(cohort)中不一致螺捐。
研究者還觀察到淋巴結(jié)和原發(fā)性腫瘤間質(zhì)和免疫細(xì)胞的特征和表現(xiàn)的總體一致性颠悬,雖然有一些重要的區(qū)別!
EMT的部分狀態(tài)或p-EMT
EMT程序被廣泛認(rèn)為是耐藥定血,侵襲和轉(zhuǎn)移的潛在驅(qū)動(dòng)因素赔癌,是一個(gè)連續(xù)和變化的過程。因此澜沟,研究者仔細(xì)檢查了ECM計(jì)劃中EMT的特征灾票。除ECM基因如基質(zhì)金屬蛋白酶,層粘連蛋白和整聯(lián)蛋白外茫虽,該程序還包括EMT標(biāo)志物波形蛋白(VIM)和整聯(lián)蛋白α-5(ITGA5)刊苍。此外既们,該方案中得分最高的基因之一是轉(zhuǎn)化生長因子(TGF)-b誘導(dǎo)(TGFBI),暗示經(jīng)典的EMT調(diào)節(jié)劑TGF-b正什。
雖然該程序具有經(jīng)典EMT的關(guān)鍵特征啥纸,但缺乏其他標(biāo)志。
首先婴氮,雖然特征伴隨著某些上皮基因的表達(dá)降低斯棒,但是上皮標(biāo)記物的總體表達(dá)還是明顯地保持下來。
其次主经,研究者沒有檢測到經(jīng)典EMT TF荣暮,ZEB1 / 2,TWIST1 / 2和SNAIL1的表達(dá)罩驻。只有SNAIL2被檢測到(在70%的HNSCC細(xì)胞中)穗酥,盡管其表達(dá)與腫瘤的程序相關(guān),但與腫瘤內(nèi)個(gè)體細(xì)胞的程序并不相關(guān)惠遏。最近的研究表明SNAIL2比其他EMT TFs早砾跃。 SNAIL2也涉及傷口愈合中的p-EMT應(yīng)答。
因此爽哎,研究者建議這里確定的體內(nèi)程序反映了一個(gè)EMT的部分狀態(tài)或p-EMT蜓席。
上圖的分析結(jié)果表明,這個(gè)p-EMT程序不同于源自細(xì)胞系和腫瘤模型的完整EMT程序课锌,以及源自腫瘤的腫瘤譜間充質(zhì)特征厨内。
把TCGA的分類應(yīng)用于scRNA-seq數(shù)據(jù)
TCGA研究分析了數(shù)百個(gè)HNSCC腫瘤的表達(dá)譜,并將它們分為四個(gè)亞型:基礎(chǔ)型渺贤,間充質(zhì)型雏胃,經(jīng)典型和非典型型。在TCGA的cohort里面各個(gè)類別的樣本比例是:atypical(24%),mesenchymal(27%),basal(31%)和classical(18%)志鞍。盡管TCGA分型是從大量腫瘤細(xì)胞中獲取的瞭亮,但研究者推斷單個(gè)細(xì)胞組分的表達(dá)程序可能使研究者能夠提取更多的了解。具體而言固棚,研究者從這些批量數(shù)據(jù)中定義的分子亞型判斷是否能夠反映惡性程序统翩,惡性細(xì)胞組成和/或TME組成的差異。
研究者首先確定了自己研究計(jì)劃的十個(gè)HNSCC腫瘤病人的TCGA表達(dá)亞型此洲。
研究者評(píng)估了每個(gè)腫瘤的惡性細(xì)胞與其亞型表達(dá)特征的對(duì)應(yīng)關(guān)系厂汗。引人注目的是,每個(gè)腫瘤清楚地映射到三個(gè)亞型之一:基本型(n = 7)呜师,經(jīng)典型(n = 2)娶桦,或非典型(n = 1)。沒有一個(gè)惡性細(xì)胞映射到間充質(zhì)亞型,即使它是口腔腫瘤中第二常見的亞型衷畦。然而栗涂,當(dāng)研究者增大分析樣本數(shù)目,當(dāng)樣本中包括基質(zhì)和免疫細(xì)胞時(shí)祈争,發(fā)現(xiàn)數(shù)百CAFs斤程、肌成纖維細(xì)胞和肌細(xì)胞映射到間充質(zhì)亞型。
這一發(fā)現(xiàn)提出了一種可能性铛嘱,即TCGA間充質(zhì)亞型反映大批量樣品中的高基質(zhì)表現(xiàn)而不是獨(dú)特的惡性細(xì)胞程序暖释。實(shí)際上,TCGA樣品的分析鑒定到間充質(zhì)亞型腫瘤高度表達(dá)對(duì)CAF和肌細(xì)胞特異性的基因墨吓。此外,當(dāng)研究者檢查TCGA的HNSCC腫瘤的組織學(xué)切片時(shí)纹磺,鑒定到間充質(zhì)腫瘤的成纖維細(xì)胞比基礎(chǔ)型腫瘤多大約2.7倍(t檢驗(yàn)帖烘,p <0.0001)。
外顯子數(shù)據(jù)分析somatic突變
因?yàn)橥怙@子測序數(shù)據(jù)是無法下載的橄杨,這里就不過多介紹了秘症。
(文章轉(zhuǎn)自jimmy的2018年閱讀文獻(xiàn)筆記)
生信基礎(chǔ)知識(shí)大全系列:生信基礎(chǔ)知識(shí)100講
史上最強(qiáng)的生信自學(xué)環(huán)境準(zhǔn)備課來啦!式矫! 7次改版乡摹,11節(jié)課程,14K的講稿采转,30個(gè)夜晚打磨聪廉,100頁P(yáng)PT的課程。
如果需要組裝自己的服務(wù)器故慈;代辦生物信息學(xué)服務(wù)器
如果需要幫忙下載海外數(shù)據(jù)(GEO/TCGA/GTEx等等)板熊,點(diǎn)我?
如果需要線下輔導(dǎo)及培訓(xùn)察绷,看招學(xué)徒
如果需要個(gè)人電腦:個(gè)人計(jì)算機(jī)推薦
如果需要置辦生物信息學(xué)書籍干签,看:生信人必備書單
如果需要實(shí)習(xí)崗位:實(shí)習(xí)職位發(fā)布
如果需要售后:點(diǎn)我
如果需要入門資料大全:點(diǎn)我