按照分析套路呼寸,梳理一下癌癥研究中的scRNA-seq計(jì)算方法...

scRNA-seq已廣泛應(yīng)用于癌癥相關(guān)研究,單細(xì)胞分辨率的轉(zhuǎn)錄組分析能夠定量檢測腫瘤內(nèi)細(xì)胞表型多樣性的分子活性猴贰。這樣的高維數(shù)據(jù)需要計(jì)算分析对雪,以提取有關(guān)驅(qū)動(dòng)癌癥發(fā)展、發(fā)病機(jī)制和臨床結(jié)果的細(xì)胞類型和狀態(tài)的相關(guān)生物學(xué)信息米绕。

來自美國的科研人員在《Experimental & Molecular Medicine》發(fā)表綜述文章瑟捣,聚焦癌癥研究中單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)的計(jì)算分析,總結(jié)了與癌癥研究相關(guān)分析的計(jì)算方法栅干,并討論了未來計(jì)算方法發(fā)展所面臨的挑戰(zhàn)和機(jī)遇迈套。

scRNA-seq工作流程和下游計(jì)算分析?


對(duì)多個(gè)患者和疾病狀態(tài)的統(tǒng)一分析

在癌癥的背景下,單細(xì)胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)的分析往往因復(fù)雜的研究設(shè)計(jì)而變得復(fù)雜碱鳞,這些研究設(shè)計(jì)可能包括來自有病和無病個(gè)體的樣本桑李,來自同一個(gè)體在不同時(shí)間點(diǎn)采集的多個(gè)樣本(例如治療前和治療后),或來自不同個(gè)體的多個(gè)樣本劫笙,表現(xiàn)出不同的疾病狀態(tài)芙扎。

統(tǒng)一的聚類分析


已經(jīng)開發(fā)了許多計(jì)算方法,用于統(tǒng)一分析多個(gè)scRNA-seq數(shù)據(jù)集填大,其中許多方法都有一個(gè)類似的概念框架:都從降低歸一化基因表達(dá)數(shù)據(jù)的維度到較小的特征集(如潛在空間)開始戒洼,將這些特征在不同的數(shù)據(jù)集之間進(jìn)行排列,使用排列的特征來識(shí)別細(xì)胞的集群(可解釋為細(xì)胞類型)允华,最后使用排列的特征和識(shí)別的集群作為二維可視化算法的輸入圈浇,例如寥掐,MultiCCA、MNN Correct磷蜀、Scanorama召耘、Conos、LIGER和Harmony等褐隆。

或者污它,其他用于統(tǒng)一單細(xì)胞轉(zhuǎn)錄組學(xué)分析的計(jì)算方法沒有明確考慮批次信息,而是學(xué)習(xí)一個(gè)函數(shù)庶弃,將數(shù)據(jù)集映射到一個(gè)低維潛伏空間衫贬,然后應(yīng)用這個(gè)函數(shù)將來自不同樣本或批次的數(shù)據(jù)集映射到同一空間,例如scCoGAPS歇攻。

在確定了常見的細(xì)胞類型和狀態(tài)之后固惯,可以應(yīng)用額外的成分比較或差異表達(dá)分析來描述不同治療、疾病階段或其他條件之間的變化缴守。例如葬毫,廣義線性模型已被用于通過比較病例與對(duì)照組來確定細(xì)胞類型比例中的差異豐度,并確定跨培養(yǎng)條件的差異表達(dá)基因屡穗,同時(shí)使用固定效應(yīng)的變量如性別和年齡以及隨機(jī)效應(yīng)的病人和批次來計(jì)算重要的協(xié)變量贴捡。

或者,基于深層神經(jīng)網(wǎng)絡(luò)的統(tǒng)一單細(xì)胞轉(zhuǎn)錄組學(xué)分析的新方法已經(jīng)被開發(fā)出來鸡捐,通過擬合單個(gè)生成模型栈暇,可以同時(shí)對(duì)數(shù)百萬個(gè)細(xì)胞進(jìn)行批量校正、歸一化箍镜、插補(bǔ)源祈、降維和聚類,例如色迂,scVI香缺、SAUCIE。

一旦跨數(shù)據(jù)集識(shí)別出主要的單元類型歇僧,就可以應(yīng)用遞歸聚類來識(shí)別更精細(xì)的單元狀態(tài)图张。遞歸聚類已應(yīng)用于肺癌間質(zhì)細(xì)胞和腫瘤浸潤的髓樣細(xì)胞。


鑒別腫瘤細(xì)胞和非腫瘤細(xì)胞

在癌癥方面诈悍,一個(gè)獨(dú)特的分析挑戰(zhàn)是區(qū)分腫瘤細(xì)胞(如腫瘤細(xì)胞)和非腫瘤細(xì)胞(如免疫細(xì)胞祸轮、內(nèi)皮細(xì)胞和成纖維細(xì)胞)。在一些研究中侥钳,通過富集腫瘤細(xì)胞和/或通過分選去除非腫瘤細(xì)胞來規(guī)避這一挑戰(zhàn)适袜。然而,由于技術(shù)限制(例如缺乏合適的標(biāo)記)舷夺,有時(shí)無法進(jìn)行分類苦酱。此外售貌,當(dāng)目的是描述腫瘤細(xì)胞與周圍腫瘤微環(huán)境中的非腫瘤細(xì)胞結(jié)合時(shí),分類可能是不可取的疫萤。因此颂跨,許多計(jì)算方法和方法已經(jīng)被發(fā)展來區(qū)分腫瘤細(xì)胞和非腫瘤細(xì)胞。

鑒別腫瘤細(xì)胞和非腫瘤細(xì)胞


在某些癌癥中扯饶,檢測不同的標(biāo)記基因或標(biāo)記基因的組合可以區(qū)分腫瘤細(xì)胞和非腫瘤細(xì)胞恒削。例如由于多發(fā)性骨髓瘤細(xì)胞以CD38+/CD138+抗原表達(dá)為標(biāo)志。

基于表達(dá)的CNV推斷的計(jì)算方法也已被應(yīng)用于區(qū)分許多癌癥中的腫瘤細(xì)胞和非腫瘤細(xì)胞帝际,包括各種膠質(zhì)瘤蔓同、黑色素瘤、頭頸癌蹲诀、乳腺癌和多發(fā)性骨髓瘤。對(duì)于不存在大規(guī)模的CNV癌癥弃揽,其他較小規(guī)模的DNA水平改變脯爪,如體細(xì)胞點(diǎn)突變,也可以從scRNA-seq數(shù)據(jù)中識(shí)別出來矿微,并用于區(qū)分腫瘤細(xì)胞痕慢。然而,從scRNA-seq數(shù)據(jù)中檢測體細(xì)胞點(diǎn)突變僅限于在具有足夠讀覆蓋率的位點(diǎn)上表達(dá)的外顯子內(nèi)的突變涌矢。

除了區(qū)分腫瘤細(xì)胞和非腫瘤細(xì)胞外掖举,CNV推斷和體細(xì)胞突變調(diào)用還可以用來區(qū)分基因上不同的腫瘤亞克隆。值得注意的是娜庇,通過從scRNA-seq數(shù)據(jù)推斷出這種變化塔次,可以直接比較遺傳亞克隆的轉(zhuǎn)錄譜,以表征所觀察到的遺傳變化的轉(zhuǎn)錄后果名秀。

然而励负,一些癌癥并不是由大規(guī)模CNVs或體細(xì)胞點(diǎn)突變來明確定義的。例如匕得,慢性粒細(xì)胞白血布逃堋(CML)細(xì)胞通常由BCR-ABL融合基因的存在來定義。雖然基因融合可以在用全轉(zhuǎn)錄scRNA-seq流程(例如SmartSeq2)生成的數(shù)據(jù)中檢測到汁掠,但檢測靈敏度的限制可能導(dǎo)致假陰性略吨。為了可靠地檢測基因融合,可以調(diào)整scRNA-seq文庫制備方案考阱,以包括用于特定基因融合的靶向擴(kuò)增引物翠忠。


推測與腫瘤微環(huán)境的交流

腫瘤細(xì)胞存在于腫瘤微環(huán)境中的非腫瘤細(xì)胞類型和狀態(tài)的異質(zhì)組成中,可能導(dǎo)致腫瘤逃逸和進(jìn)展羔砾、血管生成和治療抵抗负间。scRNA-seq為腫瘤微環(huán)境中多種細(xì)胞類型(從間質(zhì)成纖維細(xì)胞到多種免疫亞型)的特征化提供了一個(gè)高通量和無偏的方法偶妖。除了描述腫瘤微環(huán)境的異質(zhì)性外,還發(fā)展了計(jì)算方法來推斷不同細(xì)胞類型之間假定的通訊政溃。

細(xì)胞通訊的推斷


為了推斷細(xì)胞類型之間的假定通信趾访,細(xì)胞-細(xì)胞通信方法通常依賴于使用已知受體和相應(yīng)配體的詳細(xì)列表比較一種細(xì)胞類型中的受體基因和另一種細(xì)胞類型中的相應(yīng)配體基因的表達(dá)水平。例如董虱,CellPhoneDB扼鞋、基于圖形的零分布生成方法等。在分析大量scRNA-seq數(shù)據(jù)集時(shí)愤诱,還可以通過計(jì)算一種細(xì)胞類型中受體基因表達(dá)與另一種細(xì)胞類型中相應(yīng)配體基因表達(dá)在所有scRNA-seq數(shù)據(jù)集中的相關(guān)性來確定假定的通訊云头。最近,通過使用一種稱為NicheNet的計(jì)算方法擴(kuò)展了這些想法淫半,該方法將基因表達(dá)數(shù)據(jù)與細(xì)胞內(nèi)信號(hào)和基因調(diào)控網(wǎng)絡(luò)的先驗(yàn)知識(shí)相結(jié)合溃槐,識(shí)別一種細(xì)胞類型中與另一種細(xì)胞類型中相應(yīng)受體下游基因表達(dá)相關(guān)的配體。

由于分析的患者和樣本數(shù)量有限科吭,僅關(guān)注scRNA-seq數(shù)據(jù)集的方法在統(tǒng)計(jì)能力方面可能受到限制昏滴。為了提升利用大型RNA-seq樣本集的可用性,在從scRNA-seq數(shù)據(jù)中識(shí)別出細(xì)胞類型特異性標(biāo)記后对人,已經(jīng)開發(fā)了計(jì)算去卷積方法來推斷不同免疫和基質(zhì)細(xì)胞批量RNA-seq樣本的比例谣殊。


描述腫瘤和微環(huán)境的進(jìn)化

雖然單細(xì)胞轉(zhuǎn)錄組分析技術(shù)(如scRNA-seq)以單細(xì)胞分辨率提供轉(zhuǎn)錄組范圍的分子測量,但這些測量最終代表了時(shí)間上的單個(gè)快照牺弄。由于癌癥進(jìn)化的連續(xù)性和更廣泛的細(xì)胞發(fā)育姻几,這種缺乏時(shí)間信息的現(xiàn)象特別限制了對(duì)癌癥和其他動(dòng)態(tài)過程的研究。為了推斷細(xì)胞在假定軌跡中的偽時(shí)間順序势告,已經(jīng)開發(fā)許多計(jì)算軌跡推斷方法蛇捌,在癌癥方面軌跡推斷分析已被應(yīng)用于健康和腎癌的scRNA-seq數(shù)據(jù)。

結(jié)合RNA速度分析的軌跡推斷


雖然軌跡推斷方法能夠沿某些軸定位細(xì)胞培慌,但目前的方法無法估計(jì)通過推斷軌跡的進(jìn)展速度或方向的潛在時(shí)間動(dòng)力學(xué)豁陆。關(guān)于基因表達(dá)模式的先驗(yàn)知識(shí)可能有助于建立代表正常發(fā)育過程的軌跡方向性,我們可以假設(shè)軌跡從表達(dá)干細(xì)胞相關(guān)通路的細(xì)胞開始吵护,到表達(dá)成熟相關(guān)通路的細(xì)胞結(jié)束盒音。然而,這樣的假設(shè)在癌癥環(huán)境中可能不再有效馅而。RNA速度分析可以通過提供推斷軌跡的方向性來解決這些限制祥诽。例如,RNA速度分析在肝癌樹突狀細(xì)胞(DC)上的應(yīng)用表明瓮恭,兩種不同的傳統(tǒng)DC亞群有匯聚并轉(zhuǎn)化為LAMP3+腫瘤相關(guān)DC的潛力雄坪。雖然軌跡推斷和RNA速度分析的應(yīng)用為識(shí)別癌癥發(fā)病機(jī)制的改變提供了可能,但在癌癥環(huán)境中應(yīng)用這種分析時(shí)應(yīng)考慮一些預(yù)防措施屯蹦,特別是在解釋腫瘤細(xì)胞的結(jié)果時(shí)维哈。

隨著分析的細(xì)胞和樣本的數(shù)量繼續(xù)倍增绳姨,特別是國際合作,如Human Cell Atlas阔挠、Human Developmental Cell Atlas飘庄、Pediatric Cell Atlas、HuBMAP购撼、Human Tumor Atlas Network,跪削、LifeTime EU Flagship等,有必要通過實(shí)施改進(jìn)和算法優(yōu)化迂求,提高計(jì)算方法的可擴(kuò)展性碾盐。雖然這些計(jì)算方法在癌癥環(huán)境中的應(yīng)用可能會(huì)帶來一些獨(dú)特的挑戰(zhàn),但最終還需要在數(shù)據(jù)驅(qū)動(dòng)的假設(shè)生成和計(jì)算預(yù)測的正交驗(yàn)證之間進(jìn)行反復(fù)優(yōu)化揩局。這些挑戰(zhàn)為單細(xì)胞轉(zhuǎn)錄組學(xué)分析提供了巨大的機(jī)會(huì)毫玖,有助于我們了解癌癥的異質(zhì)性、發(fā)病機(jī)制谐腰、進(jìn)化和微環(huán)境的相互作用孕豹,為新的治療創(chuàng)新奠定了基礎(chǔ)。


首發(fā)公號(hào):國家基因庫大數(shù)據(jù)平臺(tái)

參考文獻(xiàn)

Fan J, Slowikowski K, Zhang F. Single-cell transcriptomics in cancer: computational challenges and opportunities[J]. Experimental & Molecular Medicine, 2020, 52(9): 1452-1465.

圖片均來源于參考文獻(xiàn)十气,如有侵權(quán)請聯(lián)系刪除。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末春霍,一起剝皮案震驚了整個(gè)濱河市砸西,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌址儒,老刑警劉巖芹枷,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異莲趣,居然都是意外死亡鸳慈,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門喧伞,熙熙樓的掌柜王于貴愁眉苦臉地迎上來走芋,“玉大人,你說我怎么就攤上這事潘鲫∥坛眩” “怎么了?”我有些...
    開封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵溉仑,是天一觀的道長挖函。 經(jīng)常有香客問我,道長浊竟,這世上最難降的妖魔是什么怨喘? 我笑而不...
    開封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任津畸,我火速辦了婚禮,結(jié)果婚禮上必怜,老公的妹妹穿的比我還像新娘肉拓。我一直安慰自己,他們只是感情好棚赔,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開白布帝簇。 她就那樣靜靜地躺著,像睡著了一般靠益。 火紅的嫁衣襯著肌膚如雪丧肴。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天胧后,我揣著相機(jī)與錄音芋浮,去河邊找鬼。 笑死壳快,一個(gè)胖子當(dāng)著我的面吹牛纸巷,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播眶痰,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼瘤旨,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了竖伯?” 一聲冷哼從身側(cè)響起存哲,我...
    開封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎七婴,沒想到半個(gè)月后祟偷,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡打厘,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年修肠,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片户盯。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡嵌施,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出先舷,到底是詐尸還是另有隱情艰管,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布蒋川,位于F島的核電站牲芋,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜缸浦,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一夕冲、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧裂逐,春花似錦歹鱼、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至掺涛,卻和暖如春庭敦,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背薪缆。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來泰國打工秧廉, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人拣帽。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓疼电,卻偏偏與公主長得像,于是被迫代替她去往敵國和親减拭。 傳聞我的和親對(duì)象是個(gè)殘疾皇子蔽豺,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容