原理
在單細(xì)胞RNA測(cè)序(RNA-seq)中礁苗,一個(gè)主要的挑戰(zhàn)是它只能提供細(xì)胞在測(cè)量時(shí)的靜態(tài)狀態(tài)爬凑,而無(wú)法隨時(shí)間跟蹤細(xì)胞的變化。RNA速度(RNA velocity)的概念(La Manno等试伙,2018)突破了這一限制嘁信,不僅能顯示細(xì)胞的當(dāng)前狀態(tài)于样,還能揭示細(xì)胞在轉(zhuǎn)錄組空間中的運(yùn)動(dòng)方向和速度,從而為研究細(xì)胞動(dòng)力學(xué)提供了新的方法潘靖,進(jìn)而實(shí)現(xiàn)細(xì)胞動(dòng)力學(xué)的預(yù)測(cè)模型穿剖。
RNA Velo 基于基因中剪接和非剪接信使RNA(mRNA)比例,描述了基因在特定時(shí)間點(diǎn)的表達(dá)變化速率卦溢。然而糊余,如果不滿足關(guān)于常規(guī)剪接速率的假設(shè),或是觀察到的穩(wěn)態(tài)mRNA水平與實(shí)際剪接動(dòng)力學(xué)不一致单寂,那么RNA速度的估計(jì)可能會(huì)有誤差贬芥。ScVelo 通過(guò)利用基于似然的動(dòng)態(tài)模型,解決了這一問(wèn)題宣决。它擴(kuò)展了RNA Velo蘸劈,使其適用于那些在發(fā)育或?qū)_動(dòng)反應(yīng)中常見(jiàn)的瞬態(tài)細(xì)胞狀態(tài)。
ScVelo 能夠推斷特定基因的轉(zhuǎn)錄疲扎、剪接和降解速率昵时,重建每個(gè)細(xì)胞在潛在分化過(guò)程中的位置,并識(shí)別可能的驅(qū)動(dòng)基因椒丧。ScVelo提出了三種模型壹甥,其中穩(wěn)態(tài)模型(La Manno等,2018)通過(guò)觀察到的未剪接與剪接mRNA的比例與推斷的穩(wěn)態(tài)比率的差異來(lái)估計(jì)速度壶熏。在穩(wěn)態(tài)模型中句柠,RNA速度通過(guò)對(duì)預(yù)計(jì)達(dá)到穩(wěn)態(tài)表達(dá)水平的細(xì)胞進(jìn)行線性回歸近似估計(jì)。然而棒假,這個(gè)方法假設(shè)每個(gè)細(xì)胞的降解率和剪接率等參數(shù)是固定的溯职,這顯然是不現(xiàn)實(shí)的。
因此帽哑,ScVelo推出了動(dòng)態(tài)模型谜酒,該模型引入了期望最大化(Expectation Maximization, EM)算法,通過(guò)最大似然法迭代逼近轉(zhuǎn)錄速率妻枕、未剪接到剪接的剪接速率和剪接后mRNA產(chǎn)物的降解速率僻族,并學(xué)習(xí)特定基因的剪接/未剪接軌跡。通過(guò)這種方式屡谐,動(dòng)態(tài)模型能夠更準(zhǔn)確地恢復(fù)每個(gè)細(xì)胞在潛在分化過(guò)程中的位置述么,并識(shí)別可能的關(guān)鍵驅(qū)動(dòng)基因。與穩(wěn)態(tài)模型相比愕掏,動(dòng)態(tài)模型通常能在相鄰細(xì)胞之間產(chǎn)生更一致的速度估計(jì)度秘,并更準(zhǔn)確地識(shí)別轉(zhuǎn)錄狀態(tài)。
結(jié)果介紹
1 數(shù)據(jù)質(zhì)量
很多人都不太重視這個(gè)圖饵撑,但是很重要剑梳。該圖顯示的是每個(gè)細(xì)胞類型的剪切/未剪切count的比例唆貌,10x單細(xì)胞普通轉(zhuǎn)錄組的數(shù)據(jù)基因剪切和未剪切比例大概是8:2,10X單細(xì)胞核轉(zhuǎn)錄組的結(jié)果和常規(guī)轉(zhuǎn)錄組剛好相反阻荒,這是因?yàn)槠胀ㄞD(zhuǎn)錄組的細(xì)胞核是完整的挠锥,捕獲的mRNA都是已經(jīng)剪切后成熟的mRNA,而核轉(zhuǎn)錄組捕獲的是核內(nèi)未成熟的mRNA侨赡。
此外蓖租,從不同細(xì)胞類型的剪切比例變化,我們也能大概看出一個(gè)分化的趨勢(shì)羊壹!
2 細(xì)胞速度矢量可視化
這個(gè)圖和其他三個(gè)圖都是展示細(xì)胞的分化軌跡蓖宦,箭頭的長(zhǎng)度和方向代表細(xì)胞分化的速度和方向
3 潛伏時(shí)間
潛伏時(shí)間是一個(gè)虛擬的概念,是通過(guò)Scvelo推斷給每個(gè)細(xì)胞一個(gè)潛在的時(shí)間油猫,只基于轉(zhuǎn)錄組學(xué)稠茂。表示一個(gè)細(xì)胞在分化過(guò)程中所處的一個(gè)位置。
該圖就是將所有細(xì)胞的潛伏時(shí)間嵌入到umap圖上情妖,數(shù)值越低的細(xì)胞睬关,表示該細(xì)胞分化程度越低,而數(shù)值越高的細(xì)胞毡证,表示該細(xì)胞的分化接近終末狀態(tài)
該圖的橫坐標(biāo)是按潛在時(shí)間(latent time)排序的細(xì)胞电爹,縱坐標(biāo)是基因。熱圖數(shù)據(jù)展示了前300個(gè)高似然基因在這些細(xì)胞中的表達(dá)量料睛。通過(guò)將這300個(gè)高似然基因沿著潛在時(shí)間進(jìn)行動(dòng)態(tài)分析丐箩,可以觀察到一個(gè)清晰的轉(zhuǎn)錄級(jí)聯(lián)過(guò)程。
從小提琴圖恤煞,也可以看到一個(gè)細(xì)胞的分化軌跡
4 高似然基因
scvelo的動(dòng)態(tài)模型與穩(wěn)態(tài)模型不同的地方就是穩(wěn)態(tài)模型假設(shè)基因的剪切率屎勘、降解率等都是一定的,但是動(dòng)態(tài)模型中通過(guò)似然的模型居扒,動(dòng)態(tài)的去計(jì)算每個(gè)細(xì)胞的剪切率概漱、降解率等參數(shù),那些對(duì)該模型貢獻(xiàn)較高的基因就被稱為高似然基因喜喂。
作者認(rèn)為這些高似然基因可以認(rèn)為是驅(qū)動(dòng)基因瓤摧,可以被明顯的檢測(cè)到。
該圖為T(mén)op15的高似然基因的基因相圖夜惭。橫坐標(biāo)是剪切數(shù)姻灶,縱坐標(biāo)是未剪切數(shù)铛绰,紫色虛線表示穩(wěn)態(tài)比率诈茧,實(shí)線代表推斷的軌跡,虛線上部分表示上圖捂掰,下半部分是下調(diào)敢会。
再放大一種的這張圖看看曾沈,Cpe基因在黃色,橙色鸥昏,綠色塞俱,藍(lán)色簇中上調(diào)。它在這些簇中有高未剪切占比吏垮,且速度方向?yàn)辄S色障涯,橙色,綠色膳汪,藍(lán)色唯蝶。
該圖的橫坐標(biāo)是latenet time,縱坐標(biāo)是基因表達(dá)量遗嗽,我們可以很清楚的看到這些基因在某一個(gè)時(shí)刻粘我,有一個(gè)明顯的上升或者下降的斷點(diǎn),而這些斷點(diǎn)痹换,剛好是細(xì)胞類型的分界點(diǎn)征字。