博文名稱:RNA Velocity: The Cell’s Internal Compass
博文鏈接:https://towardsdatascience.com/rna-velocity-the-cells-internal-compass-cf8d75bb2f89
發(fā)表時(shí)間:Sep 1, 2021
單細(xì)胞RNA測(cè)序 (scRNA-seq) 在過(guò)去十年中徹底改變了我們研究細(xì)胞生物學(xué)的方式,單細(xì)胞基因組學(xué)領(lǐng)域迎來(lái)了快速發(fā)展屯曹。scRNA-seq使我們能夠分析單個(gè)細(xì)胞的轉(zhuǎn)錄組碾牌,從而全面了解它們的功能和身份。 轉(zhuǎn)錄組是指細(xì)胞的所有信使核糖核酸 (mRNA) 分子的集合休讳。在過(guò)去的一年中,你可能經(jīng)常聽(tīng)說(shuō)過(guò)mRNA,許多COVID-19疫苗都依賴于這種分子觉吭。mRNA是基因的讀出和轉(zhuǎn)錄宜鸯。這些分子攜帶有關(guān)細(xì)胞用來(lái)構(gòu)建蛋白質(zhì)的目的基因的信息憔古。在mRNA的COVID-19疫苗中,它們攜帶有關(guān)如何制造針對(duì)SARS-CoV2病毒的良性蛋白質(zhì)的信息淋袖,有效地教會(huì)我們的身體如何抵抗感染鸿市。這些mRNA 分子的產(chǎn)生稱為轉(zhuǎn)錄,這些分子有時(shí)也相應(yīng)地稱為轉(zhuǎn)錄本。你經(jīng)常會(huì)聽(tīng)到生物學(xué)家將mRNA豐度更廣泛地稱為基因表達(dá)焰情。你可以把它想象成建造宜家(IKEA)的家具:指令是轉(zhuǎn)錄的mRNA分子陌凳,相應(yīng)的蛋白質(zhì)是家具。然而内舟,在mRNA被翻譯之前合敦,它必須經(jīng)歷一個(gè)額外的步驟。那些不編碼蛋白質(zhì)的mRNA分子片段稱為內(nèi)含子验游。這些內(nèi)含子在蛋白質(zhì)翻譯之前會(huì)被去除充岛,這個(gè)過(guò)程稱為剪接。mRNA其余部分稱為外顯子耕蝉。
你可以將轉(zhuǎn)錄組信息視為細(xì)胞指紋崔梗,通過(guò)識(shí)別它將其與其他細(xì)胞區(qū)分開(kāi)來(lái)(例如,紅細(xì)胞與神經(jīng)元)垒在。通過(guò)對(duì)數(shù)十萬(wàn)個(gè)細(xì)胞的轉(zhuǎn)錄組進(jìn)行測(cè)序蒜魄,我們可以構(gòu)建一個(gè)完整的、高維的細(xì)胞狀態(tài)圖爪膊,這些細(xì)胞狀態(tài)在干細(xì)胞轉(zhuǎn)變?yōu)楦鼗募?xì)胞(如神經(jīng)元)权悟、表征癌癥腫瘤以及區(qū)分患者的健康和患病組織。單細(xì)胞測(cè)序因此產(chǎn)生了GB級(jí)數(shù)據(jù)需要分析和理解推盛,由于我們的數(shù)據(jù)集有很多維度峦阁,每個(gè)維度對(duì)應(yīng)一個(gè)基因,這可能會(huì)變得復(fù)雜耘成。 這看起來(lái)很酷榔昔,對(duì)吧? 但是瘪菌,這種方法有一個(gè)嚴(yán)重的缺點(diǎn)撒会。 這些測(cè)序?qū)嶒?yàn)會(huì)殺死實(shí)驗(yàn)過(guò)程中的細(xì)胞,阻止我們?cè)谝院蟮臅r(shí)間點(diǎn)再次對(duì)這些細(xì)胞進(jìn)行重新測(cè)序师妙。 因此诵肛,我們只剩下細(xì)胞mRNA豐度的靜態(tài)快照,這使得推斷其未來(lái)的基因表達(dá)具有挑戰(zhàn)性默穴。 我們?nèi)绾谓鉀Q這個(gè)問(wèn)題怔檩?
這就是RNA速率的用武之地。 RNA速率是一種簡(jiǎn)單而強(qiáng)大的方法蓄诽,可以讓我們預(yù)測(cè)細(xì)胞未來(lái)的基因表達(dá)薛训。前面我們提到的mRNA可以通過(guò)剪接(spliced)和未剪接(unspliced)轉(zhuǎn)錄本來(lái)區(qū)分。雖然剪接轉(zhuǎn)錄本是大多數(shù)scRNA-seq實(shí)驗(yàn)的主要讀數(shù)仑氛,但也檢測(cè)了未剪接轉(zhuǎn)錄本的表達(dá)乙埃。使用這些額外的信息闸英,我們可以建立一個(gè)簡(jiǎn)單的數(shù)學(xué)模型來(lái)預(yù)測(cè)未來(lái)的剪接表達(dá)。
其中u是未剪接的mRNA分子數(shù)介袜,s是剪接后的 mRNA 分子數(shù)甫何,α是轉(zhuǎn)錄速率,β是未剪接到剪接的剪接速率遇伞,γ是剪接后mRNA產(chǎn)物的降解速率沛豌。
絕大多數(shù)情形下的RNA-seq實(shí)驗(yàn)所測(cè)得的由轉(zhuǎn)錄本片段數(shù)所代表的基因表達(dá)量實(shí)際上僅是基因轉(zhuǎn)錄、RNA剪接赃额、RNA降解等一系列胞內(nèi)化學(xué)反應(yīng)達(dá)到穩(wěn)態(tài)時(shí)的RNA分子總豐度加派。
根據(jù)給定細(xì)胞的特定基因的未來(lái)mRNA表達(dá)與當(dāng)前mRNA之間的差異,我們可以推導(dǎo)出基因表達(dá)變化的度量跳芳。這些可以針對(duì)給定細(xì)胞的所有基因進(jìn)行聚合芍锦,以創(chuàng)建細(xì)胞未來(lái)轉(zhuǎn)錄組的向量,代表所述細(xì)胞變化的速度和方向——因此稱為 RNA 速率飞盆。一種常見(jiàn)的可視化方法是將向量場(chǎng)疊加到嵌入圖中的細(xì)胞上娄琉,如下所示:
這是經(jīng)歷神經(jīng)發(fā)育的細(xì)胞的PCA圖 - 大腦中神經(jīng)元(紅色)由稱為徑向神經(jīng)膠質(zhì)(藍(lán)色)的干細(xì)胞樣細(xì)胞產(chǎn)生吓歇。每個(gè)點(diǎn)代表一個(gè)細(xì)胞孽水,上面疊加了一個(gè) RNA 速率向量,預(yù)測(cè)細(xì)胞轉(zhuǎn)變城看。注意這些箭頭為何在中間階段(神經(jīng)母細(xì)胞和未成熟神經(jīng)元)變長(zhǎng)——這表明基因表達(dá)的動(dòng)態(tài)變化女气,因?yàn)樯窠?jīng)元的基因被打開(kāi),而徑向神經(jīng)膠質(zhì)細(xì)胞的基因被關(guān)閉测柠。隨著這些細(xì)胞成功轉(zhuǎn)變?yōu)樯窠?jīng)元炼鞠,箭頭迅速縮短,反映了這些細(xì)胞基因表達(dá)的“減速”轰胁。你可以將這些箭頭視為類似于細(xì)胞的指南針:一個(gè)內(nèi)部的GPS谒主,可以確定細(xì)胞想要成為神經(jīng)元時(shí)需要去的方向。
RNA 速率有兩種主要模型:穩(wěn)態(tài)模型(steady-state model)和動(dòng)態(tài)模型(dynamical model)赃阀。穩(wěn)態(tài)模型是在Nature 上發(fā)表的原始模型霎肯,如上圖所示。該模型假設(shè)通用的榛斯、轉(zhuǎn)錄組范圍內(nèi)的剪接率观游,并且基因表達(dá)遵循穩(wěn)態(tài):即,當(dāng)ds/dt=0時(shí)肖抱,速度估計(jì)為與γ擬合的剪接分子與未剪接分子的比率的偏差备典,由u = γs.异旧。我在下面有一個(gè)例子:
該圖根據(jù)SOX2基因轉(zhuǎn)錄的剪接與未剪接分子計(jì)數(shù)繪制了先前顯示的神經(jīng)發(fā)生PCA中的單個(gè)細(xì)胞意述,SOX2是放射狀膠質(zhì)細(xì)胞的標(biāo)記(藍(lán)色)。實(shí)線是從廣義線性回歸模型導(dǎo)出的u=γs擬合。這條線(u>γs)以上的細(xì)胞被認(rèn)為具有正速度荤崇。這意味著未剪接SOX2 mRNA分子的產(chǎn)生超過(guò)其拼接對(duì)應(yīng)物的降解:我們有SOX2 mRNA的凈產(chǎn)出拌屏。相比之下,黑線(u<γs)以下的細(xì)胞具有負(fù)速度:降解的SOX2多于產(chǎn)生的SOX2术荤,導(dǎo)致凈損失倚喂。直線上的細(xì)胞速度為零,因?yàn)樗鼈儧](méi)有偏離未拼接與拼接mRNA分子的γ擬合比率瓣戚。
相比之下端圈,動(dòng)態(tài)模型直接求解每個(gè)基因的完整轉(zhuǎn)錄動(dòng)力學(xué),而不是進(jìn)行轉(zhuǎn)錄組范圍的假設(shè)子库。它不是嘗試將數(shù)據(jù)擬合到回歸模型中舱权,而是使用期望最大化算法(Expectation Maximization,EM)來(lái)估計(jì)參數(shù)仑嗅,該算法使用最大似然來(lái)迭代逼近α宴倍、β和γ,并學(xué)習(xí)給定基因的剪接/未剪接軌跡仓技。這為每個(gè)基因分配了如下似然函數(shù):
而
分別代表觀察到的細(xì)胞i中特定基因的未剪接和剪接mRNA分子鸵贬,而x?? 表示時(shí)間t時(shí)的未剪接/剪接分子i基于推斷的參數(shù)集 θ = (α, β, γ) 。具有高可能性的基因被認(rèn)為是引起人們興趣的生物現(xiàn)象—在我們的例子中脖捻,神經(jīng)發(fā)生neurogenesis—?jiǎng)討B(tài)變化的主要因素阔逼。但是,算了吧地沮,讓我們看看它的實(shí)際效果颜价!
現(xiàn)在讓我們自己嘗試RNA速率,請(qǐng)使用以下任一pip安裝包 scvelo:
pip install -U scvelo
如果你更喜歡conda诉濒,您可以通過(guò)bioconda渠道進(jìn)行安裝周伦,如下所示:
conda install -c bioconda scvelo
你還需要scanpy,可以從conda-forge安裝它未荒。這是一個(gè)流行的Python單細(xì)胞分析庫(kù)专挪。
conda install -c conda-forge scanpy
我們將使用上面描述的人類神經(jīng)發(fā)育數(shù)據(jù)集作為示例,我將通過(guò)案例說(shuō)明和比較穩(wěn)態(tài)模型和動(dòng)態(tài)模型片排。該數(shù)據(jù)集包含1720個(gè)細(xì)胞寨腔,代表神經(jīng)發(fā)育過(guò)程中的四種主要細(xì)胞類型:放射狀膠質(zhì)細(xì)胞(radial glia)、成神經(jīng)細(xì)胞(neuroblasts)率寡、未成熟神經(jīng)元(immature neurons)和神經(jīng)元(neurons)迫卢。
首先,我們將從網(wǎng)上下載數(shù)據(jù)集:
from urllib.request import urlretrieve
urlretrieve("http://pklab.med.harvard.edu/velocyto/hgForebrainGlut/hgForebrainGlut.loom", "data/hgForebrainGlut.loom")
然后冶共,導(dǎo)入我們的包
import numpy as np
import pandas as pd
import scanpy as sc
import scvelo as scv
# scv.logging.print_version()
scv.settings.verbosity = 3 # show errors(0), warnings(1), info(2), hints(3)
scv.settings.presenter_view = True # set max width size for presenter view
scv.settings.set_figure_params('scvelo') # for beautified visualization
我們將我們的數(shù)據(jù)集讀入一個(gè)Annotated Data (anndata) 對(duì)象乾蛤。這是一種在Python中存儲(chǔ)用于分析的單細(xì)胞數(shù)據(jù)的流行方法:
adata = scv.read('data/hgForebrainGlut.loom')
adata.var_names_make_unique()
# standard pre-processing for scRNA-seq
scv.pp.filter_and_normalize(adata, min_shared_counts=20, n_top_genes=2000) #this filters cells with low counts of spliced/unspliced mRNA molecules, and keeps the top 2000 highly variable genes
scv.pp.moments(adata, n_pcs=30, n_neighbors=30) #this calculates second-order moments that will be used for solving the stochastic model of RNA velocity
現(xiàn)在我們將計(jì)算RNA速率每界。 scvelo為此使用兩個(gè)函數(shù):scv.tl.velocity() 計(jì)算每個(gè)基因的速度,scv.tl.velocity_graph() 輸出基于速度和潛在細(xì)胞狀態(tài)轉(zhuǎn)換之間的余弦相似度的速度圖家卖。 換句話說(shuō)眨层,它測(cè)量細(xì)胞基因表達(dá)的變化與其預(yù)測(cè)速度向量的匹配程度,該向量可用于推導(dǎo)出轉(zhuǎn)移概率上荡。 我們還將數(shù)據(jù)中的數(shù)字聚類標(biāo)簽更改為論文中定義的細(xì)胞類型趴樱。
## This section is for changing the nomenclature of the predefined numerical clusters in the original file
new_cluster_names = [
'Radial glia 1', 'Radial glia 2',
'Neuroblast',
'Immature Neuron 1', 'Immature Neuron 2',
'Neuron 1', 'Neuron 2']
# adata.rename_categories('Clusters', new_cluster_names)
adata.obs.Clusters = adata.obs.Clusters.astype('category')
adata.obs.Clusters= adata.obs.Clusters.cat.rename_categories(new_cluster_names)
newNames = np.array(adata.obs['Clusters'])
for i in range(len(adata.obs['Clusters'])):
if (adata.obs['Clusters'][i] == 'Immature Neuron 1' or adata.obs['Clusters'][i] == 'Immature Neuron 2'):
newNames[i] = 'Immature Neuron'
elif (adata.obs['Clusters'][i] == 'Radial glia 1' or adata.obs['Clusters'][i] == 'Radial glia 2'):
newNames[i] = 'Radial glia'
elif (adata.obs['Clusters'][i] == 'Neuron 1' or adata.obs['Clusters'][i] == 'Neuron 2'):
newNames[i] = 'Neuron'
adata.obs['Cell_types'] = newNames
scv.tl.velocity(adata, mode='deterministic')
scv.tl.velocity_graph(adata)
sc.tl.pca(adata)
scv.pl.velocity_embedding(adata, arrow_length=3, color = 'Cell_types', legend_loc = 'on data', arrow_size=1.4, dpi=150)
scv.pl.velocity_embedding_stream(adata, color = "Cell_types", size = 20,alpha =0.9, save="scvelo_velocity-embedding-stream-cluster.png", figsize=(7,7), dpi=600, legend_fontsize = 8, show=False, title='')
下面為我們提供了PCA 圖,類似于論文中的圖:
說(shuō)明:我在服務(wù)器測(cè)試了該案例酪捡,代碼運(yùn)行有點(diǎn)小問(wèn)題叁征,我更改了,另外出圖也不一致逛薇,應(yīng)該是scvelo版本的問(wèn)題航揉。左圖是文章的原圖;右圖是我生成的RNA速率圖金刁。
如你所見(jiàn)帅涂,每個(gè)細(xì)胞上都疊加了一個(gè)箭頭,用于預(yù)測(cè)其未來(lái)的轉(zhuǎn)錄組尤蛮。這些方向一致的箭頭給了我們一種全局方向感媳友,顯示了從徑向神經(jīng)膠質(zhì)細(xì)胞到神經(jīng)元的線性進(jìn)展。 但是产捞,你可能已經(jīng)注意到醇锚,一些綠色的神經(jīng)母細(xì)胞(neuroblasts)似乎正在恢復(fù)為放射狀膠質(zhì)細(xì)胞。 在一些神經(jīng)元中也有類似的現(xiàn)象坯临,盡管程度較輕焊唬。 這些回流可歸因于兩個(gè)主要原因:1) 如前所述,原始RNA速率模型的穩(wěn)態(tài)假設(shè)不能準(zhǔn)確反映更多瞬態(tài)細(xì)胞群看靠,例如神經(jīng)母細(xì)胞赶促; 2)scRNA-seq非常稀疏。 基因很容易逃避測(cè)序平臺(tái)的檢測(cè)挟炬,導(dǎo)致“丟失”(drop-out)鸥滨,這些mRNA測(cè)量值被錯(cuò)誤地記錄為零。 規(guī)避這種情況的一種方法是使用缺值填補(bǔ)(imputation)谤祖,我們通過(guò)計(jì)算推斷缺失值婿滓。 一種類似的方法是通過(guò)數(shù)據(jù)平滑來(lái)消除由固有稀疏性產(chǎn)生的噪聲,原始論文的作者通過(guò) k-最近鄰池化來(lái)做到這一點(diǎn)粥喜。 這些方法中的每一種都有缺點(diǎn)凸主,并且關(guān)于是否應(yīng)該將它們完全用于scRNA-seq分析的爭(zhēng)論也是如此,因?yàn)榻Y(jié)果可能會(huì)產(chǎn)生誤導(dǎo)额湘。 出于本文的目的卿吐,我將繼續(xù)以原始形式呈現(xiàn)數(shù)據(jù)集旁舰。
我們可以通過(guò)生成相位圖進(jìn)一步探索細(xì)胞的基因特異的速率變化:
scv.pl.velocity(adata, var_names='SOX2', color = 'Cell_types', colorbar=True)
scv.pl.velocity(adata, var_names='SOX2', color = 'Cell_types', colorbar=True, save="steady-state.png")
最左側(cè)是SOX2表達(dá)的剪接與未剪接圖,是放射狀膠質(zhì)細(xì)胞的標(biāo)志物但两。 每個(gè)點(diǎn)都是一個(gè)按細(xì)胞類型著色的細(xì)胞(藍(lán)色代表放射狀膠質(zhì)細(xì)胞,綠色代表神經(jīng)母細(xì)胞供置,深金色代表未成熟神經(jīng)元谨湘,紅色代表神經(jīng)元)。 如前所述芥丧,確定性模型通過(guò)假設(shè)穩(wěn)態(tài)模型來(lái)求解未來(lái)表達(dá)量紧阔。 這條黑線代表 ds/dt 穩(wěn)態(tài)解的回歸擬合,用 u = γs 表示续担。 假定這條線以上的細(xì)胞具有正速率:SOX2 被上調(diào)擅耽,這些細(xì)胞中產(chǎn)生的凈產(chǎn)量超過(guò)其降解。 我們看到一些放射狀膠質(zhì)細(xì)胞似乎顯示出這種現(xiàn)象物遇,如右側(cè)的表達(dá)圖所示乖仇,上面PCA圖中的細(xì)胞根據(jù)它們的SOX2表達(dá)水平進(jìn)行著色。 然而询兴,大多數(shù)正在關(guān)閉SOX2活性(由中間圖中的負(fù)速度表示)乃沙,因?yàn)樗鼈冮_(kāi)始分化,正如在其他細(xì)胞類型中SOX2的零速度所證明的那樣:它們不再為它轉(zhuǎn)錄或降解mRNA分子 诗舰,這解釋了這些細(xì)胞類型中的最低表達(dá)水平警儒。
如前所述,雖然功能強(qiáng)大眶根,但穩(wěn)態(tài)模型的局限性在于它假設(shè)穩(wěn)態(tài)表達(dá)水平和恒定剪接速率蜀铲。 在更復(fù)雜的系統(tǒng)中,具有多個(gè)最終狀態(tài)(即干細(xì)胞可以最終分化為不同的細(xì)胞)和異質(zhì)亞群属百,這種假設(shè)可能會(huì)失敗并產(chǎn)生錯(cuò)誤的解釋记劝。 這就是前面提到的動(dòng)態(tài)模型的用武之地。我們可以使用以下代碼實(shí)現(xiàn)動(dòng)態(tài)模型:
scv.tl.recover_dynamics(adata) # this line takes about two minutes to run
scv.tl.velocity(adata, mode='dynamical')
scv.tl.velocity_graph(adata)
scv.pl.velocity_embedding(adata, arrow_length=3, color = 'Cell_types', legend_loc = 'on data', arrow_size=1.4, dpi=150)
scv.pl.velocity_embedding(adata, arrow_length=3, color = 'Cell_types', legend_loc = 'on data', arrow_size=1.4, dpi=150, save="dynamical-state.png")
在這里族扰,我們觀察到neuroblasts相鄰細(xì)胞之間在方向上有更大的一致性(盡管成神經(jīng)細(xì)胞之間在方向上仍然存在分歧隆夯,這可以通過(guò)數(shù)據(jù)平滑來(lái)解決),有明顯的主導(dǎo)趨勢(shì)朝向神經(jīng)元别伏。 使用每個(gè)基因的似然估計(jì)蹄衷,我們可以提取表現(xiàn)出最顯著的動(dòng)態(tài)行為的基因:
top_genes = adata.var['fit_likelihood'].sort_values(ascending=False).index[:100]
adata.var['fit_likelihood'].sort_values(ascending=False)[:15] # Look at the likelihoods for the top 15 genes
NPAS3 0.994760
CREB5 0.896914
FOS 0.882965
SLC1A3 0.806150
SYT1 0.749349
MYT1L 0.737498
MAPT 0.687999
GLI3 0.663777
DOK5 0.656130
LINC01158 0.651856
RBFOX1 0.608533
TCF4 0.592459
FRMD4B 0.580061
HMGN3 0.577301
ZBTB20 0.575223
Name: fit_likelihood, dtype: float64
scv.pl.scatter(adata, basis='RBFOX1', color = 'Cell_types')
scv.pl.scatter(adata, basis='RBFOX1', color = 'Cell_types', save="RBFOX1.png")
該圖顯示了基因RBFOX1的未剪接/剪接的軌跡,圖中的點(diǎn)根據(jù)細(xì)胞類型著色(藍(lán)色代表放射狀膠質(zhì)細(xì)胞厘肮,綠色代表神經(jīng)母細(xì)胞愧口,深金色代表未成熟神經(jīng)元,紅色代表神經(jīng)元)类茂,以及學(xué)習(xí)來(lái)自EM算法的動(dòng)力學(xué)擬合曲線耍属,用紫色曲線表示托嚣。 你可以看到實(shí)線如何提供比虛線穩(wěn)態(tài)模型更好的擬合,隨著細(xì)胞從徑向膠質(zhì)細(xì)胞到神經(jīng)元厚骗,未剪接mRNA相對(duì)于剪接mRNA的轉(zhuǎn)錄迅速增加示启,表明該基因在神經(jīng)元中被激活,而在放射狀膠質(zhì)細(xì)胞中則不活躍领舰。 我們可以觀察到幾個(gè)基因在神經(jīng)發(fā)生的不同部分上調(diào)和下調(diào)的類似動(dòng)態(tài)夫嗓,如下所示:
scv.pl.scatter(adata, basis=top_genes[:6], ncols = 3, color = 'Cell_types', figsize = (14,14))
scv.pl.scatter(adata, basis=top_genes[:6], ncols = 3, color = 'Cell_types', figsize = (14,14), save="top_genes.png")
最后的思考
scRNA-seq的一個(gè)主要缺點(diǎn)是它只產(chǎn)生細(xì)胞轉(zhuǎn)錄組的快照;你無(wú)法重新對(duì)你的樣本進(jìn)行連續(xù)測(cè)序冲秽。RNA速率是規(guī)避這一限制的有效方法舍咖,通過(guò)利用 RNA生物學(xué)來(lái)推斷未來(lái)的基因表達(dá),繪制細(xì)胞的內(nèi)在的轉(zhuǎn)錄指南并為你的數(shù)據(jù)提供發(fā)育方向锉桑。這可以用來(lái)說(shuō)明細(xì)胞到達(dá)特定終點(diǎn)的不同途徑排霉,基因表達(dá)變化的速度,構(gòu)建干細(xì)胞如何變得更加特化的整體軌跡民轴,等等攻柠。然而,它并非沒(méi)有自身的局限性后裸。 如前所述辙诞,scRNA-seq數(shù)據(jù)通常是稀疏且嘈雜的。 另外轻抱,對(duì)于描述良好的生物過(guò)程來(lái)說(shuō)飞涂,RNA速率隨后可能是不直觀的,或者根本不正確的祈搜。 雖然缺值填補(bǔ)(imputation)和數(shù)據(jù)平滑( data smoothing)等方法可以幫助糾正這些問(wèn)題较店,但應(yīng)謹(jǐn)慎使用它們,因?yàn)樗鼈內(nèi)菀紫龑?shí)際生物噪聲容燕,從而提供“有價(jià)值”的見(jiàn)解梁呈,例如向我們數(shù)據(jù)集中不存在的細(xì)胞的潛在轉(zhuǎn)變。
盡管如此蘸秘,它是一種強(qiáng)大的方法官卡,為理解高維生物數(shù)據(jù)提供了很多清晰度,并且隨著數(shù)據(jù)科學(xué)領(lǐng)域的不斷發(fā)展醋虏,這種方法將繼續(xù)得到進(jìn)一步完善寻咒。 這十年單細(xì)胞基因組學(xué)的目標(biāo)之一是有效整合測(cè)量細(xì)胞不同特性(例如,RNA颈嚼、蛋白質(zhì)毛秘、表觀遺傳學(xué)等)的高維數(shù)據(jù)集。 可以擴(kuò)展 RNA 速率等方法來(lái)了解這些不同模式之間的關(guān)系,從而對(duì)細(xì)胞間的轉(zhuǎn)換做出強(qiáng)有力的推斷叫挟,從而微調(diào)細(xì)胞的指南針艰匙。
參考文獻(xiàn):
[1] G. La Manno, R. Soldatov, A. Zeisel, E. Braun, H. Hochgerner, V. Petukhov, K. Lidschreiber, M. E. Kastriti, P. L?nnerberg, A. Furlan, J. Fan, L. E. Borm, Z. Liu, D. van Bruggen, J. Guo, X. He, R. Barker, E. Sundstr?m, G. Castelo-Branco, P. Cramer, I. Adameyko, S. Linnarsson, and P. V. Kharchenko, RNA velocity of single cells, (2018), Nature
[2] V. Bergen, M. Lange, S. Peidli, F. Alexander Wolf & F. J. Theis, Generalizing RNA velocity to transient cell states through dynamical modeling, (2020), Nature Biotechnology
[3] V. Bergen, R. Soldatov, P. V. Kharchenko, F. J. Theis, RNA velocity — current challenges and future perspectives, (2021), Molecular Systems Biology