scRNA-seq已廣泛應(yīng)用于癌癥相關(guān)研究,單細(xì)胞分辨率的轉(zhuǎn)錄組分析能夠定量檢測腫瘤內(nèi)細(xì)胞表型多樣性的分子活性猴贰。這樣的高維數(shù)據(jù)需要計(jì)算分析对雪,以提取有關(guān)驅(qū)動(dòng)癌癥發(fā)展、發(fā)病機(jī)制和臨床結(jié)果的細(xì)胞類型和狀態(tài)的相關(guān)生物學(xué)信息米绕。
來自美國的科研人員在《Experimental & Molecular Medicine》發(fā)表綜述文章瑟捣,聚焦癌癥研究中單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)的計(jì)算分析,總結(jié)了與癌癥研究相關(guān)分析的計(jì)算方法栅干,并討論了未來計(jì)算方法發(fā)展所面臨的挑戰(zhàn)和機(jī)遇迈套。
對(duì)多個(gè)患者和疾病狀態(tài)的統(tǒng)一分析
在癌癥的背景下,單細(xì)胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)的分析往往因復(fù)雜的研究設(shè)計(jì)而變得復(fù)雜碱鳞,這些研究設(shè)計(jì)可能包括來自有病和無病個(gè)體的樣本桑李,來自同一個(gè)體在不同時(shí)間點(diǎn)采集的多個(gè)樣本(例如治療前和治療后),或來自不同個(gè)體的多個(gè)樣本劫笙,表現(xiàn)出不同的疾病狀態(tài)芙扎。
已經(jīng)開發(fā)了許多計(jì)算方法,用于統(tǒng)一分析多個(gè)scRNA-seq數(shù)據(jù)集填大,其中許多方法都有一個(gè)類似的概念框架:都從降低歸一化基因表達(dá)數(shù)據(jù)的維度到較小的特征集(如潛在空間)開始戒洼,將這些特征在不同的數(shù)據(jù)集之間進(jìn)行排列,使用排列的特征來識(shí)別細(xì)胞的集群(可解釋為細(xì)胞類型)允华,最后使用排列的特征和識(shí)別的集群作為二維可視化算法的輸入圈浇,例如寥掐,MultiCCA、MNN Correct磷蜀、Scanorama召耘、Conos、LIGER和Harmony等褐隆。
或者污它,其他用于統(tǒng)一單細(xì)胞轉(zhuǎn)錄組學(xué)分析的計(jì)算方法沒有明確考慮批次信息,而是學(xué)習(xí)一個(gè)函數(shù)庶弃,將數(shù)據(jù)集映射到一個(gè)低維潛伏空間衫贬,然后應(yīng)用這個(gè)函數(shù)將來自不同樣本或批次的數(shù)據(jù)集映射到同一空間,例如scCoGAPS歇攻。
在確定了常見的細(xì)胞類型和狀態(tài)之后固惯,可以應(yīng)用額外的成分比較或差異表達(dá)分析來描述不同治療、疾病階段或其他條件之間的變化缴守。例如葬毫,廣義線性模型已被用于通過比較病例與對(duì)照組來確定細(xì)胞類型比例中的差異豐度,并確定跨培養(yǎng)條件的差異表達(dá)基因屡穗,同時(shí)使用固定效應(yīng)的變量如性別和年齡以及隨機(jī)效應(yīng)的病人和批次來計(jì)算重要的協(xié)變量贴捡。
或者,基于深層神經(jīng)網(wǎng)絡(luò)的統(tǒng)一單細(xì)胞轉(zhuǎn)錄組學(xué)分析的新方法已經(jīng)被開發(fā)出來鸡捐,通過擬合單個(gè)生成模型栈暇,可以同時(shí)對(duì)數(shù)百萬個(gè)細(xì)胞進(jìn)行批量校正、歸一化箍镜、插補(bǔ)源祈、降維和聚類,例如色迂,scVI香缺、SAUCIE。
一旦跨數(shù)據(jù)集識(shí)別出主要的單元類型歇僧,就可以應(yīng)用遞歸聚類來識(shí)別更精細(xì)的單元狀態(tài)图张。遞歸聚類已應(yīng)用于肺癌間質(zhì)細(xì)胞和腫瘤浸潤的髓樣細(xì)胞。
鑒別腫瘤細(xì)胞和非腫瘤細(xì)胞
在癌癥方面诈悍,一個(gè)獨(dú)特的分析挑戰(zhàn)是區(qū)分腫瘤細(xì)胞(如腫瘤細(xì)胞)和非腫瘤細(xì)胞(如免疫細(xì)胞祸轮、內(nèi)皮細(xì)胞和成纖維細(xì)胞)。在一些研究中侥钳,通過富集腫瘤細(xì)胞和/或通過分選去除非腫瘤細(xì)胞來規(guī)避這一挑戰(zhàn)适袜。然而,由于技術(shù)限制(例如缺乏合適的標(biāo)記)舷夺,有時(shí)無法進(jìn)行分類苦酱。此外售貌,當(dāng)目的是描述腫瘤細(xì)胞與周圍腫瘤微環(huán)境中的非腫瘤細(xì)胞結(jié)合時(shí),分類可能是不可取的疫萤。因此颂跨,許多計(jì)算方法和方法已經(jīng)被發(fā)展來區(qū)分腫瘤細(xì)胞和非腫瘤細(xì)胞。
在某些癌癥中扯饶,檢測不同的標(biāo)記基因或標(biāo)記基因的組合可以區(qū)分腫瘤細(xì)胞和非腫瘤細(xì)胞恒削。例如由于多發(fā)性骨髓瘤細(xì)胞以CD38+/CD138+抗原表達(dá)為標(biāo)志。
基于表達(dá)的CNV推斷的計(jì)算方法也已被應(yīng)用于區(qū)分許多癌癥中的腫瘤細(xì)胞和非腫瘤細(xì)胞帝际,包括各種膠質(zhì)瘤蔓同、黑色素瘤、頭頸癌蹲诀、乳腺癌和多發(fā)性骨髓瘤。對(duì)于不存在大規(guī)模的CNV癌癥弃揽,其他較小規(guī)模的DNA水平改變脯爪,如體細(xì)胞點(diǎn)突變,也可以從scRNA-seq數(shù)據(jù)中識(shí)別出來矿微,并用于區(qū)分腫瘤細(xì)胞痕慢。然而,從scRNA-seq數(shù)據(jù)中檢測體細(xì)胞點(diǎn)突變僅限于在具有足夠讀覆蓋率的位點(diǎn)上表達(dá)的外顯子內(nèi)的突變涌矢。
除了區(qū)分腫瘤細(xì)胞和非腫瘤細(xì)胞外掖举,CNV推斷和體細(xì)胞突變調(diào)用還可以用來區(qū)分基因上不同的腫瘤亞克隆。值得注意的是娜庇,通過從scRNA-seq數(shù)據(jù)推斷出這種變化塔次,可以直接比較遺傳亞克隆的轉(zhuǎn)錄譜,以表征所觀察到的遺傳變化的轉(zhuǎn)錄后果名秀。
然而励负,一些癌癥并不是由大規(guī)模CNVs或體細(xì)胞點(diǎn)突變來明確定義的。例如匕得,慢性粒細(xì)胞白血布逃堋(CML)細(xì)胞通常由BCR-ABL融合基因的存在來定義。雖然基因融合可以在用全轉(zhuǎn)錄scRNA-seq流程(例如SmartSeq2)生成的數(shù)據(jù)中檢測到汁掠,但檢測靈敏度的限制可能導(dǎo)致假陰性略吨。為了可靠地檢測基因融合,可以調(diào)整scRNA-seq文庫制備方案考阱,以包括用于特定基因融合的靶向擴(kuò)增引物翠忠。
推測與腫瘤微環(huán)境的交流
腫瘤細(xì)胞存在于腫瘤微環(huán)境中的非腫瘤細(xì)胞類型和狀態(tài)的異質(zhì)組成中,可能導(dǎo)致腫瘤逃逸和進(jìn)展羔砾、血管生成和治療抵抗负间。scRNA-seq為腫瘤微環(huán)境中多種細(xì)胞類型(從間質(zhì)成纖維細(xì)胞到多種免疫亞型)的特征化提供了一個(gè)高通量和無偏的方法偶妖。除了描述腫瘤微環(huán)境的異質(zhì)性外,還發(fā)展了計(jì)算方法來推斷不同細(xì)胞類型之間假定的通訊政溃。
為了推斷細(xì)胞類型之間的假定通信趾访,細(xì)胞-細(xì)胞通信方法通常依賴于使用已知受體和相應(yīng)配體的詳細(xì)列表比較一種細(xì)胞類型中的受體基因和另一種細(xì)胞類型中的相應(yīng)配體基因的表達(dá)水平。例如董虱,CellPhoneDB扼鞋、基于圖形的零分布生成方法等。在分析大量scRNA-seq數(shù)據(jù)集時(shí)愤诱,還可以通過計(jì)算一種細(xì)胞類型中受體基因表達(dá)與另一種細(xì)胞類型中相應(yīng)配體基因表達(dá)在所有scRNA-seq數(shù)據(jù)集中的相關(guān)性來確定假定的通訊云头。最近,通過使用一種稱為NicheNet的計(jì)算方法擴(kuò)展了這些想法淫半,該方法將基因表達(dá)數(shù)據(jù)與細(xì)胞內(nèi)信號(hào)和基因調(diào)控網(wǎng)絡(luò)的先驗(yàn)知識(shí)相結(jié)合溃槐,識(shí)別一種細(xì)胞類型中與另一種細(xì)胞類型中相應(yīng)受體下游基因表達(dá)相關(guān)的配體。
由于分析的患者和樣本數(shù)量有限科吭,僅關(guān)注scRNA-seq數(shù)據(jù)集的方法在統(tǒng)計(jì)能力方面可能受到限制昏滴。為了提升利用大型RNA-seq樣本集的可用性,在從scRNA-seq數(shù)據(jù)中識(shí)別出細(xì)胞類型特異性標(biāo)記后对人,已經(jīng)開發(fā)了計(jì)算去卷積方法來推斷不同免疫和基質(zhì)細(xì)胞批量RNA-seq樣本的比例谣殊。
描述腫瘤和微環(huán)境的進(jìn)化
雖然單細(xì)胞轉(zhuǎn)錄組分析技術(shù)(如scRNA-seq)以單細(xì)胞分辨率提供轉(zhuǎn)錄組范圍的分子測量,但這些測量最終代表了時(shí)間上的單個(gè)快照牺弄。由于癌癥進(jìn)化的連續(xù)性和更廣泛的細(xì)胞發(fā)育姻几,這種缺乏時(shí)間信息的現(xiàn)象特別限制了對(duì)癌癥和其他動(dòng)態(tài)過程的研究。為了推斷細(xì)胞在假定軌跡中的偽時(shí)間順序势告,已經(jīng)開發(fā)許多計(jì)算軌跡推斷方法蛇捌,在癌癥方面軌跡推斷分析已被應(yīng)用于健康和腎癌的scRNA-seq數(shù)據(jù)。
雖然軌跡推斷方法能夠沿某些軸定位細(xì)胞培慌,但目前的方法無法估計(jì)通過推斷軌跡的進(jìn)展速度或方向的潛在時(shí)間動(dòng)力學(xué)豁陆。關(guān)于基因表達(dá)模式的先驗(yàn)知識(shí)可能有助于建立代表正常發(fā)育過程的軌跡方向性,我們可以假設(shè)軌跡從表達(dá)干細(xì)胞相關(guān)通路的細(xì)胞開始吵护,到表達(dá)成熟相關(guān)通路的細(xì)胞結(jié)束盒音。然而,這樣的假設(shè)在癌癥環(huán)境中可能不再有效馅而。RNA速度分析可以通過提供推斷軌跡的方向性來解決這些限制祥诽。例如,RNA速度分析在肝癌樹突狀細(xì)胞(DC)上的應(yīng)用表明瓮恭,兩種不同的傳統(tǒng)DC亞群有匯聚并轉(zhuǎn)化為LAMP3+腫瘤相關(guān)DC的潛力雄坪。雖然軌跡推斷和RNA速度分析的應(yīng)用為識(shí)別癌癥發(fā)病機(jī)制的改變提供了可能,但在癌癥環(huán)境中應(yīng)用這種分析時(shí)應(yīng)考慮一些預(yù)防措施屯蹦,特別是在解釋腫瘤細(xì)胞的結(jié)果時(shí)维哈。
隨著分析的細(xì)胞和樣本的數(shù)量繼續(xù)倍增绳姨,特別是國際合作,如Human Cell Atlas阔挠、Human Developmental Cell Atlas飘庄、Pediatric Cell Atlas、HuBMAP购撼、Human Tumor Atlas Network,跪削、LifeTime EU Flagship等,有必要通過實(shí)施改進(jìn)和算法優(yōu)化迂求,提高計(jì)算方法的可擴(kuò)展性碾盐。雖然這些計(jì)算方法在癌癥環(huán)境中的應(yīng)用可能會(huì)帶來一些獨(dú)特的挑戰(zhàn),但最終還需要在數(shù)據(jù)驅(qū)動(dòng)的假設(shè)生成和計(jì)算預(yù)測的正交驗(yàn)證之間進(jìn)行反復(fù)優(yōu)化揩局。這些挑戰(zhàn)為單細(xì)胞轉(zhuǎn)錄組學(xué)分析提供了巨大的機(jī)會(huì)毫玖,有助于我們了解癌癥的異質(zhì)性、發(fā)病機(jī)制谐腰、進(jìn)化和微環(huán)境的相互作用孕豹,為新的治療創(chuàng)新奠定了基礎(chǔ)。
首發(fā)公號(hào):國家基因庫大數(shù)據(jù)平臺(tái)
參考文獻(xiàn)
Fan J, Slowikowski K, Zhang F. Single-cell transcriptomics in cancer: computational challenges and opportunities[J]. Experimental & Molecular Medicine, 2020, 52(9): 1452-1465.
圖片均來源于參考文獻(xiàn)十气,如有侵權(quán)請聯(lián)系刪除。