單細(xì)胞RNA測序(scRNA-seq)能夠測量單個細(xì)胞分辨時的基因表達(dá)哎壳。組織中數(shù)千個細(xì)胞的大規(guī)模轉(zhuǎn)錄分析成為可能的同時颊埃,大規(guī)模多路復(fù)用單細(xì)胞圖譜分析使得復(fù)雜狮斗。在大多數(shù)情況下,單個細(xì)胞的真實(shí)身份是未知的复哆,需要從轉(zhuǎn)錄數(shù)據(jù)推斷。現(xiàn)有的方法通常是基于基因表達(dá)譜的相似性對細(xì)胞進(jìn)行聚類腌零,并使用平均表達(dá)水平對每個聚類內(nèi)的所有細(xì)胞分配相同的身份梯找。然而,scRNA-seq實(shí)驗通常為每個細(xì)胞產(chǎn)生低覆蓋率的測序數(shù)據(jù)益涧,這阻礙了聚類過程锈锤。
我們引入了scMatch,它通過識別大型參考數(shù)據(jù)集中的最接近匹配來直接注釋single cell 闲询。我們使用這一策略注釋各種單細(xì)胞數(shù)據(jù)集久免,并評估測序深度、相似性度量和參考數(shù)據(jù)集的影響扭弧。我們發(fā)現(xiàn)scMatch可以快速有力地注釋單細(xì)胞阎姥,其準(zhǔn)確性與另一個最近的細(xì)胞注釋工具(SingleR)相當(dāng),但它更快鸽捻,可以處理更大的參考數(shù)據(jù)集呼巴。我們演示了scMatch如何處理結(jié)合來自多個來源的數(shù)據(jù)的大型定制的參考基因表達(dá)譜,從而使研究人員能夠精確地識別任何復(fù)雜組織中的細(xì)胞群御蒲。
scMatch是python寫的伊磺,所以如果喜歡用python可以一試,在算法上并沒有比SingleR的創(chuàng)新删咱,也是算的相關(guān)性屑埋。
所有的基于參考數(shù)據(jù)集的方法都對參考數(shù)據(jù)集有著嚴(yán)重的依賴,所以如何構(gòu)建好的參考數(shù)據(jù)集才是當(dāng)前我們急需要思考的問題痰滋。
另一個主要的點(diǎn)在于摘能,scMatch也參考了cell ontology,看來cell ontology將成為細(xì)胞注釋的一個基準(zhǔn)敲街。
Rui Hou, Elena Denisenko, Alistair R R Forrest, scMatch: a single-cell gene expression profile annotation tool using reference datasets, Bioinformatics, Volume 35, Issue 22, 15 November 2019, Pages 4688–4695, https://doi.org/10.1093/bioinformatics/btz292