說(shuō)在前面
在單細(xì)胞數(shù)據(jù)分析流程中,細(xì)胞亞群注釋的準(zhǔn)確性一直都是重中之重记罚,生信寶庫(kù)在之前的推文:一文解決單細(xì)胞亞群注釋的所有問(wèn)題中壳嚎,已經(jīng)介紹了解決單細(xì)胞亞群注釋常見(jiàn)問(wèn)題的一些方法桐智,并且給出了Immugent基于多年單細(xì)胞分析經(jīng)驗(yàn)的各種細(xì)胞marker genes烟馅。
此外,在推文 SciBet:一個(gè)軟件解決單細(xì)胞注釋所有煩惱 中刊驴,我們又介紹了基于機(jī)器學(xué)習(xí)的算法來(lái)進(jìn)行單細(xì)胞自動(dòng)化注釋的方法寡润。事實(shí)上,機(jī)器學(xué)習(xí)因?yàn)榫邆潇`活躲惰、準(zhǔn)確变抽、可優(yōu)化等一系列特點(diǎn)氮块,非常適用于單細(xì)胞亞群注釋诡宗。截止到目前,已經(jīng)有很多基于機(jī)器學(xué)習(xí)的單細(xì)胞注釋軟件被開(kāi)發(fā)出來(lái)锰提,今天Immugent就來(lái)介紹另一款基于機(jī)器學(xué)習(xí)的單細(xì)胞亞群注釋軟件:mtSC芳悲,相應(yīng)的文章在2021年以題為:Integrating multiple references for single-cell assignment的形式發(fā)表在Nucleic Acids Res雜志上。
下面我們通過(guò)原文來(lái)了解一下mtSC相對(duì)于其它同類(lèi)軟件的優(yōu)點(diǎn)谅年,和使用流程肮韧。
主要流程
Immugent先放一張mtSC的工作流程圖,同樣的弄企,小編自己是不咋能看懂的拘领。。约素。
但是沒(méi)有關(guān)系,因?yàn)槲覀兒芏嗳瞬⒉皇窍雽W(xué)習(xí)它的開(kāi)發(fā)流程用于開(kāi)發(fā)自己的軟件士葫,而是使用它送悔。
下面就是需要通過(guò)和其它同類(lèi)軟件進(jìn)行比較欠啤,來(lái)突出mtSC的優(yōu)點(diǎn)了。作者首先和PCA和DML算法(深度度量學(xué)習(xí))來(lái)比較跪妥,從下圖我們可以清楚看到,相比于其它兩款軟件mtSC注釋出的細(xì)胞群分布更加緊湊侦香,每一種細(xì)胞亞群的內(nèi)部各細(xì)胞之間的一致性也更高。
接下來(lái)憾赁,作者就使用現(xiàn)有的工具對(duì)mtsc進(jìn)行基準(zhǔn)測(cè)試,以便使用多個(gè)參考引用數(shù)據(jù)集進(jìn)行單細(xì)胞亞群注釋筋现。通過(guò)下圖我們可以看到相比于其它三種整合多參考數(shù)據(jù)集進(jìn)行單細(xì)胞亞群注釋的方法晦款,mtSC不僅在準(zhǔn)確性上更高枚冗,而且更快,需要的計(jì)算資源更少坛怪。
下面就要重點(diǎn)說(shuō)一下mtSC的最大的優(yōu)點(diǎn)了股囊,那就是它可以整合多個(gè)參考數(shù)據(jù)集對(duì)細(xì)胞亞群進(jìn)行注釋。在這個(gè)軟件被開(kāi)發(fā)出之前沉帮,我們一般對(duì)單細(xì)胞亞群進(jìn)行注釋都只能將一個(gè)已經(jīng)注釋好的數(shù)據(jù)集作為參考贫堰,但是考慮到不同的數(shù)據(jù)來(lái)源不同的平臺(tái)或者不同版本的試劑(如10x的v2, v3試劑盒)待牵,就導(dǎo)致注釋出的細(xì)胞亞群效果并不理想,而mtSC可以同時(shí)整合多個(gè)參考數(shù)據(jù)集進(jìn)行單細(xì)胞亞群注釋?zhuān)覐南聢D我們可以看出整合多個(gè)數(shù)據(jù)集進(jìn)行注釋的結(jié)果更加準(zhǔn)確偎行。
mtSC的另一大優(yōu)勢(shì)是它可以進(jìn)行跨物種的單細(xì)胞亞群注釋蛤袒。
我們知道因?yàn)閭惱韺W(xué)的限制膨更,科研工作者無(wú)法直接在人體上進(jìn)行功能實(shí)驗(yàn),在日痴涞拢科研工作中使用最多的就是小鼠模型了。但是因?yàn)樵诒磉_(dá)定量時(shí)使用的參考基因組不同锈候,我們無(wú)法直接將基于小鼠模型得到的細(xì)胞亞群注釋結(jié)果映射到人的細(xì)胞上,而mtSC就可以很好的幫我們解決這個(gè)問(wèn)題摄职。
小結(jié)
高效準(zhǔn)確的單細(xì)胞亞群注釋對(duì)單細(xì)胞測(cè)序數(shù)據(jù)分析至關(guān)重要获列,隨著近些年單細(xì)胞測(cè)序數(shù)據(jù)的爆炸式增長(zhǎng),對(duì)于同一種組織歌懒,可以有多個(gè)單細(xì)胞測(cè)序數(shù)據(jù)源溯壶。我們可以通過(guò)可以集成同類(lèi)多個(gè)參考數(shù)據(jù)集,進(jìn)一步提高單細(xì)胞亞群注釋验烧。然而又跛,由于多引用存在數(shù)據(jù)異構(gòu)的巨大挑戰(zhàn),目前仍缺乏有效的集成框架慨蓝。
為此,mtSC提出了一個(gè)靈活的單細(xì)胞注釋解決方案弧满,該框架集成了基于多任務(wù)深度度量學(xué)習(xí)的多個(gè)參考點(diǎn)此熬,專(zhuān)為設(shè)計(jì)使用多個(gè)單細(xì)胞測(cè)序數(shù)據(jù)作為參考的組織中的細(xì)胞類(lèi)型識(shí)別。作者在一套全面的公開(kāi)可用的基準(zhǔn)數(shù)據(jù)集上評(píng)估了mtSC募谎,并證明了它在多引用的整合單細(xì)胞分配方面具有最優(yōu)異的表現(xiàn)阴汇。
好啦,本期推文我們就介紹到這里吉执,歡迎有接觸到同類(lèi)軟件的小伙伴通過(guò)后臺(tái)與我們聯(lián)系,我們下期再會(huì)戳玫。