Wishbone identifies bifurcating developmental trajectories from single-cell data
1侵蒙、發(fā)表時(shí)間:2016年4月
2肾胯、期刊:Nature biotechnology
3卖擅、代碼鏈接:https://github.com/dpeerlab/wishbone/blob/master/notebooks/Wishbone_for_single_cell_RNAseq.ipynb
4凌受、用途:推斷細(xì)胞分化關(guān)系调塌、輔助鑒別細(xì)胞類型
5融击、正文:
摘要:最近的單細(xì)胞分析技術(shù)為闡明細(xì)胞分化路徑提供了前所未有的機(jī)會(huì)。在這里颓鲜,我們介紹了Wishbone,這是一種用于沿高分辨率的分叉發(fā)展軌跡定位單細(xì)胞的算法典予。Wishbone使用多維單細(xì)胞數(shù)據(jù)甜滨,例如mass cytometry(大規(guī)模流式細(xì)胞儀)或RNA-Seq數(shù)據(jù)作為輸入,并根據(jù)細(xì)胞的發(fā)育進(jìn)程對(duì)其進(jìn)行排序瘤袖,并通過將每個(gè)細(xì)胞標(biāo)記為分叉前或分叉后的兩個(gè)細(xì)胞命運(yùn)之一來確定分叉點(diǎn)衣摩。使用30通道的mass cytometry數(shù)據(jù),我們顯示了Wishbone準(zhǔn)確地恢復(fù)了小鼠胸腺T細(xì)胞發(fā)育的已知階段捂敌,包括分叉點(diǎn)艾扮。我們還將該算法應(yīng)用于小鼠骨髓分化既琴,并證明了其對(duì)其他譜系的推廣。Wishbone與diffusion maps泡嘴,SCUBA和Monocle的比較表明甫恩,它在排序細(xì)胞和識(shí)別分支點(diǎn)方面均優(yōu)于這些方法。
1酌予、引言
多細(xì)胞生物是從經(jīng)歷了許多增殖和分化階段的單細(xì)胞發(fā)育而來的磺箕,從而導(dǎo)致了各種各樣的祖細(xì)胞和終末細(xì)胞類型。盡管這些過程中的許多關(guān)鍵階段和細(xì)胞群已使用熒光激活的細(xì)胞分選和遺傳擾動(dòng)進(jìn)行了表征抛虫,但許多發(fā)展仍是未知的松靡。新興的高通量技術(shù),例如單細(xì)胞RNA-Seq和mass cytometry莱褒,可以在單細(xì)胞中同時(shí)測量大量參數(shù)击困,并在不干擾的情況下對(duì)整個(gè)組織進(jìn)行檢查。由于許多組織通過連續(xù)和異步發(fā)育維持體內(nèi)平衡广凸,這提供了以高分辨率在幾乎所有成熟階段測量細(xì)胞的機(jī)會(huì)阅茶。面臨的挑戰(zhàn)是設(shè)計(jì)一種能夠根據(jù)細(xì)胞的成熟度對(duì)細(xì)胞進(jìn)行排序并確定產(chǎn)生功能不同細(xì)胞的完整Complement的分支點(diǎn)的算法。
最近谅海,一些報(bào)告已經(jīng)證明了根據(jù)單細(xì)胞的成熟度對(duì)其排序的方法[3,4]脸哀。但是,這些方法采用的是非分支軌跡扭吁,因此很難模擬多個(gè)細(xì)胞命運(yùn)撞蜂。構(gòu)建分支軌跡的關(guān)鍵挑戰(zhàn)是根據(jù)細(xì)胞的發(fā)育成熟度對(duì)其排序,確定分支點(diǎn)以及將細(xì)胞與其各自的分支相關(guān)聯(lián)侥袜。諸如SCUBA[5]之類的方法可以識(shí)別數(shù)據(jù)中的分支以及單元的偽時(shí)間順序蝌诡,但是在時(shí)間分辨率和準(zhǔn)確性上卻有相當(dāng)大的損失。
在這里枫吧,我們介紹了分支系統(tǒng)的軌跡檢測算法Wishbone浦旱。 我們使用大規(guī)模流式細(xì)胞儀數(shù)據(jù)來測量小鼠胸腺中T細(xì)胞的發(fā)育,其中淋巴樣祖細(xì)胞分化為CD8 +細(xì)胞毒性或CD4 +輔助T細(xì)胞九杂,以證明Wishbone的準(zhǔn)確性和魯棒性颁湖。Wishbone 以高精度和發(fā)育分辨率恢復(fù)了T細(xì)胞發(fā)育的已知階段。我們沿統(tǒng)一的分支軌跡從單細(xì)胞快照中排序雙陰性(DN)1-4例隆,雙陽性(DP)甥捺,CD4 +和CD8 +細(xì)胞。結(jié)果表明镀层,與競爭方法相比镰禾,Wishbone以更高的準(zhǔn)確性和分辨率恢復(fù)了T細(xì)胞發(fā)展的已知階段,產(chǎn)生的軌跡和分支符合目前流行的T細(xì)胞分化模型和完整的細(xì)胞類型。
我們認(rèn)為吴侦,標(biāo)志物表達(dá)的異質(zhì)性在很大程度上是由于發(fā)育成熟過程中的重編程而不是表達(dá)的隨機(jī)性谷饿。此外,我們將Wishbone應(yīng)用于大規(guī)模流式細(xì)胞儀[2]妈倔,產(chǎn)生的早期和晚期人類骨髓分化數(shù)據(jù),以及使用單細(xì)胞RNA-Seq [6] 生成的小鼠骨髓分化數(shù)據(jù)绸贡。Wishbone成功地確定了從頭開始的骨髓發(fā)育中的成熟和分支點(diǎn)盯蝴,證明了其廣泛適用于多種單細(xì)胞技術(shù)的分支軌跡的系統(tǒng)。
2听怕、結(jié)果
2.1 學(xué)習(xí)分支的分化軌跡
為了根據(jù)數(shù)據(jù)推斷分支軌跡声搁,Wishbone對(duì)數(shù)據(jù)進(jìn)行了以下假設(shè):(i)分化是一個(gè)連續(xù)過程黑竞,(ii)組織的快照能夠表征整個(gè)分化過程,(iii)細(xì)胞在命運(yùn)的交叉路口只能選擇兩條分化軌跡中的一條疏旨。保守表型標(biāo)記表達(dá)的上升和下降決定了分化很魂,因此標(biāo)準(zhǔn)距離度量(歐幾里得度量)無法充分捕獲兩個(gè)細(xì)胞之間的成熟度差異(圖1a)。與我們之前發(fā)表的非分支軌跡檢測算法Wanderlust [3]類似檐涝,我們使用最近鄰圖來捕獲發(fā)育距離并使用最短路徑來識(shí)別細(xì)胞的初始順序遏匆。圖中的每個(gè)節(jié)點(diǎn)代表一個(gè)單元格,edge根據(jù)表達(dá)譜的相似性將細(xì)胞與最相似的細(xì)胞相連(圖1a)谁榜。使用最短路徑來計(jì)算單元格之間的距離幅聘,即通過圖的neighbors的一系列short steps,其中緊密相關(guān)的細(xì)胞之間的每一步都可能表示成熟度上的相似性窃植。
Wishbone使用來自輸入“分化早期細(xì)胞”的最短路徑來構(gòu)建細(xì)胞的初始順序帝蒿,隨后使用選定的一組細(xì)胞(稱為“waypoint”)進(jìn)行順序進(jìn)行優(yōu)化。最后撕瞧,waypoint之間距離的不一致性用于標(biāo)識(shí)所有細(xì)胞的branch point和分支關(guān)聯(lián)陵叽。最近鄰圖的質(zhì)量對(duì)于準(zhǔn)確排序至關(guān)重要,而噪聲的主要來源是“short-circuits”的存在丛版,即成熟度相距較遠(yuǎn)的細(xì)胞之間的虛假邊緣[3]巩掺。值得注意的是,單個(gè)short-circuits足以在發(fā)育距離較遠(yuǎn)的細(xì)胞之間重定向所有最短路徑页畦,從而導(dǎo)致錯(cuò)誤的排序胖替。short-circuits在分支數(shù)據(jù)集中特別普遍,因?yàn)榉植纥c(diǎn)之后的細(xì)胞的表型特征可能不夠明顯(補(bǔ)充圖1)。Wishbone通過在使用擴(kuò)散圖(diffusion maps)[7] 生成的縮小尺寸的投影空間中重構(gòu)graph來克服這些short-circuits独令。 擴(kuò)散圖考慮了任何一對(duì)細(xì)胞之間的所有可能路徑端朵,以大大減少短路。Wishbone使用top擴(kuò)散分量(diffusion components)來構(gòu)造graph燃箭,捕獲數(shù)據(jù)中的主要幾何結(jié)構(gòu)冲呢,同時(shí)消除可能由測量噪聲引起的微小波動(dòng)。
該算法使用一組選定的單元格(稱為Waypoints)來充當(dāng)graph不同區(qū)域的引導(dǎo)营勤。Waypoints是隨機(jī)采樣的細(xì)胞,選擇它們代表整個(gè)軌跡及其分支上的區(qū)域壹罚。每個(gè)waypoint根據(jù)其與所有其他細(xì)胞的計(jì)算距離(圖1b)提供一個(gè)視角葛作。細(xì)胞在軌跡中的位置是通過平均所有waypoint點(diǎn)的視角來確定的,越近的waypoint的權(quán)重越高渔嚷。因此进鸠,更近,更可靠的waypoint主要決定了細(xì)胞的位置形病,同時(shí)保留了遠(yuǎn)處waypoint的影響程度客年,以得出一致的全局結(jié)構(gòu)(圖1b,右下圖)漠吻。
waypoint也是識(shí)別分支點(diǎn)的關(guān)鍵试读。如果兩個(gè)waypoint i和t沿同一軌跡杠纵,則從早期細(xì)胞到t的最短路徑與經(jīng)過i的路徑之間的差值接近于零(Lsi+Lit = Lst)(圖1c,左圖)钩骇。另一方面比藻,如果兩個(gè)waypoint在不同的分支上铝量,則該差值實(shí)質(zhì)上大于零(Lsj+Ljt > Lst)(圖1c,中間圖)银亲。在存在真實(shí)分支的情況下慢叨,兩個(gè)分支的waypoints之間的分歧會(huì)累積,以創(chuàng)建兩組在每個(gè)集合內(nèi)一致而在各集合之間不一致的waypoint务蝠。這些分歧產(chǎn)生了一個(gè)結(jié)構(gòu)化的矩陣(圖1c拍谐,右圖):主干上的航點(diǎn)與所有waypoints的分歧較低,一個(gè)分支上的waypoint與同一分支上的其他waypoints一致馏段,并且與不同分支上的所有waypoints都有高度分歧(在線方法)赠尾。可以使用聚類方法識(shí)別此結(jié)構(gòu)毅弧。
具體而言,從頻譜聚類技術(shù)來看巫员,此矩陣的第二個(gè)特征向量總結(jié)了給定waypoint的所有分歧庶香,并為waypoint提供了分支關(guān)聯(lián)的定量度量(圖1d,左圖)简识。偏離零的程度是細(xì)胞成熟度的函數(shù)(圖1d赶掖,左圖)。Wishbone恢復(fù)沿其發(fā)育軌跡的細(xì)胞順序七扰,找到分支點(diǎn)奢赂,并將分支點(diǎn)之后的細(xì)胞分配給兩個(gè)分支之一(圖1d)头遭。
2.2 小鼠胸腺流式數(shù)據(jù)集分析
在小鼠胸腺的T細(xì)胞發(fā)育過程中赃磨,CD4 +輔助性T細(xì)胞和CD8 +細(xì)胞毒性T細(xì)胞從淋巴樣祖細(xì)胞分叉(圖2a)[8,9]立由。我們將Wishbone應(yīng)用于小鼠胸腺的流式細(xì)胞儀數(shù)據(jù)轧钓,并根據(jù)其在T細(xì)胞發(fā)育中的廣泛功能選擇了表面標(biāo)記和轉(zhuǎn)錄因子(補(bǔ)充表1)。我們從Black6小鼠收集了五個(gè)獨(dú)立的胸腺的數(shù)據(jù)锐膜。每個(gè)樣品平均收集了23萬個(gè)細(xì)胞毕箍。
僅使用表面標(biāo)記來計(jì)算細(xì)胞相似性(補(bǔ)充表1)并將DN細(xì)胞群體定義為起點(diǎn)伟葫,將Wishbone獨(dú)立應(yīng)用于每個(gè)胸腺數(shù)據(jù)恨搓。沿結(jié)果軌跡的標(biāo)記趨勢如圖2b所示。Wishbone準(zhǔn)確地恢復(fù)了T細(xì)胞發(fā)育的已知階段(圖2b和補(bǔ)充圖2)筏养,包括分叉成兩個(gè)單一的陽性譜系(CD4 +和CD8 +)斧抱。 具體而言,軌跡開始于DN階段(CD4-CD8-)渐溶,過渡到DP階段(CD4 + CD8 +)辉浦,最后分支到兩個(gè)單陽性(SP)種群。 我們注意到Wishbone正確地排列了DN種群:DN2(CD44 + CD25 +)茎辐,DN3(CD44-CD25 +)和DN4(CD44-CD25-)宪郊,即使這些細(xì)胞很罕見并且構(gòu)成胸腺細(xì)胞的<1% 。DN1(CD44 + CD25-)細(xì)胞極為罕見拖陆,我們?cè)谲壽E開始時(shí)確實(shí)觀察到了類似于這些細(xì)胞的特征(圖2b)弛槐。
為了進(jìn)一步測試Wishbone的準(zhǔn)確性速警,我們?cè)u(píng)估了學(xué)習(xí)軌跡時(shí)未使用的標(biāo)記的表達(dá)趨勢:轉(zhuǎn)錄因子Runx1和Bcl11b叹誉,以及信號(hào)分子Notch1(圖2c)。 所有這些標(biāo)記的豐度與其在T細(xì)胞發(fā)育的DN階段中的已知作用和時(shí)機(jī)一致(補(bǔ)充注釋1)闷旧。
Wishbone準(zhǔn)確性的其他證據(jù)是標(biāo)記在整個(gè)軌跡過程中變化的緊密性(圖2d)父腕。 不僅中位標(biāo)記水平遵循預(yù)期趨勢青瀑,而且?guī)缀趺總€(gè)單個(gè)單元格都正確放置在軌跡中,如跨大部分軌跡的標(biāo)記的低方差所示帘饶。無論標(biāo)記是否用于學(xué)習(xí)軌跡(圖2d和補(bǔ)充圖3)群扶,標(biāo)記的方差都很小竞阐,從而增強(qiáng)了Wishbone結(jié)果的魯棒性。
先前關(guān)于胸腺發(fā)育的研究主要依靠遺傳擾動(dòng)和隨后的細(xì)胞分選,而這些分選總是消除特定的發(fā)育區(qū)室颖变。在同時(shí)測量30個(gè)通道的情況下腥刹,我們可以沿著統(tǒng)一的分叉軌跡將單個(gè)胸腺的DN汉买,DP蛙粘,CD4 +和CD8 +細(xì)胞放置在一個(gè)軌跡上,并準(zhǔn)確無誤地從胸腺組織直接測量沿軌跡的多個(gè)事件的過程穴肘。我們使用導(dǎo)數(shù)分析在單個(gè)參照系中沿軌跡(圖2e)對(duì)關(guān)鍵事件進(jìn)行時(shí)間計(jì)時(shí)评抚,發(fā)現(xiàn)Wishbone使用從復(fù)雜的原始組織收集的細(xì)胞來恢復(fù)細(xì)胞的精確時(shí)間順序和分支以及高分辨率和準(zhǔn)確性(補(bǔ)充說明1和圖2b盈咳,e)边翼。
2.3 Wishbone結(jié)果在所有重復(fù)試驗(yàn)中保持一致,并且對(duì)參數(shù)選擇具有魯棒性
我們研究了軌跡和分支對(duì)各種自由參數(shù)的敏感性:用于圖構(gòu)建的鄰居數(shù)k僧凤,waypoint數(shù)nW,來自細(xì)胞的waypoint點(diǎn)采樣以及使用的擴(kuò)散分量數(shù)躯保。細(xì)胞及其分支點(diǎn)的排序?qū)τ诳缰貜?fù)的這些不同參數(shù)選擇非常魯棒性(補(bǔ)充圖5和6,以及補(bǔ)充說明2)咏连。Wishbone的結(jié)果在很大程度上排除了用于學(xué)習(xí)的單個(gè)標(biāo)記(補(bǔ)充圖7)祟滴。 此外歌溉,無論是否使用DN或SP種群的細(xì)胞作為輸入早期細(xì)胞草慧,由wishbone鑒定的分支都保持一致(補(bǔ)充圖8)匙头。
2.4 獨(dú)立細(xì)胞類型內(nèi)標(biāo)志物水平的成熟度控制
我們?cè)诮?jīng)典的細(xì)胞表面標(biāo)志物中觀察到相當(dāng)多的異質(zhì)性公给。我們假設(shè)這種變化的至少一部分可能是發(fā)育成熟的結(jié)果淌铐,其中來自不同發(fā)育階段的細(xì)胞被匯集到一個(gè)單獨(dú)的門控種群中匣沼。使用Wishbone軌跡的精細(xì)時(shí)間分辨率释涛,我們將以細(xì)胞發(fā)育進(jìn)程為條件的標(biāo)記差異與在門控細(xì)胞群中觀察到的差異進(jìn)行了比較。為了進(jìn)行比較窖认,我們首先使用標(biāo)準(zhǔn)門控方案在兩個(gè)譜系標(biāo)記:CD4和CD8的表達(dá)上鑒定了兩個(gè)SP細(xì)胞群(圖3b)燕偶。 接下來酝惧,我們將這些門控群的方差與相應(yīng)標(biāo)記的方差進(jìn)行了比較盗似,其條件取決于wishbone軌跡萌踱。 在兩個(gè)SP種群中,沿軌跡的成熟度受到控制時(shí)届谈,Wishebone譜系標(biāo)記CD4和CD8以及共受體CD3的變異比門控種群的種群變異要低得多(補(bǔ)充圖9a)艰山。
作為一項(xiàng)附加測試,我們?cè)趯W(xué)習(xí)軌跡的同時(shí)沒有使用CD3作為標(biāo)記之一就跑了Wishbone。 所確定的軌跡和分支與獲得的包括CD3的結(jié)果相似,并且在整個(gè)軌跡上僅伴隨著CD3方差的小幅增加(圖3c)嚣潜。 但是,與門控種群的變異相比酸役,所有受體和共受體分子CD4,CD8和CD3的變異沿軌跡仍顯著較低(圖3d)奄薇。 當(dāng)從學(xué)習(xí)中排除CD4或CD8中的任何一個(gè)時(shí),這些結(jié)果類似地成立(補(bǔ)充圖9b,c)。 總的來說驶俊,這些結(jié)果表明,門控種群中標(biāo)記表達(dá)異質(zhì)性的很大一部分是比較沿不同發(fā)育階段的細(xì)胞而不是標(biāo)記表達(dá)隨機(jī)性的結(jié)果刚陡。
2.5 沿著SP軌跡的轉(zhuǎn)錄因子動(dòng)力學(xué)
接下來,我們利用一個(gè)包括轉(zhuǎn)錄因子ThPOK吁朦、Gata3和Runx3在內(nèi)的修正的panel來探索關(guān)鍵轉(zhuǎn)錄因子沿著兩個(gè)SP軌跡的動(dòng)態(tài)變化柒室。ThPOK和Gata3已被證明是CD4 SP的關(guān)鍵,而Runx3被證明是CD8 SP的關(guān)鍵逗宜。這些因素沿軌跡的動(dòng)態(tài)如圖4a雄右,b所示空骚。
為了將這些轉(zhuǎn)錄因子的動(dòng)態(tài)聯(lián)系起來,我們使用CD69和CD62L來識(shí)別成熟的標(biāo)志擂仍,例如譜系承諾和成功的陰性選擇(圖4c囤屹,d)。我們的研究結(jié)果表明逢渔,這些因素在實(shí)現(xiàn)承諾時(shí)遵循不同的動(dòng)態(tài)模式肋坚。在陽性選擇期間,ThPOK和Gata3上調(diào)肃廓,但Runx3似乎僅在檢測到的分支點(diǎn)之后上調(diào)(圖4c智厌、d、補(bǔ)充注釋3和補(bǔ)充圖10)盲赊。Gata3被證明可以調(diào)節(jié)ThPOK的表達(dá)11铣鹏,并且可以解釋為什么ThPOK在表達(dá)變化上落后于Gata3(圖4c)。不同的動(dòng)態(tài)可能預(yù)示著不同的調(diào)控機(jī)制哀蘑,通過這些機(jī)制吝沫,這些因素實(shí)現(xiàn)了血統(tǒng)承諾。需要進(jìn)一步的實(shí)驗(yàn)來闡明這些機(jī)制递礼。
我們比較了沿著Wishbone軌跡的標(biāo)記動(dòng)力學(xué)和從發(fā)育中的SP細(xì)胞的選通得到的動(dòng)力學(xué)惨险,并比較了沿著Wishbone軌跡每個(gè)群體中細(xì)胞的順序。
我們觀察到脊髓,大多數(shù)門控群體中的細(xì)胞沿著軌跡分布(圖4e和補(bǔ)充圖12b)辫愉,特別是CD4+CD8int(中間型為int)群體的細(xì)胞,在這里譜系決定被認(rèn)為發(fā)生15将硝。為了解決Wishbone和gating之間的差異恭朗,我們根據(jù)其在Wishbone軌跡中的位置將CD4+CD8int細(xì)胞分為“早期”和“晚期”兩組(圖4e,在線方法)依疼,并比較兩組中已知成熟標(biāo)記物CD69痰腮、CD24和CD62L的表達(dá)。與“晚期”細(xì)胞相比律罢,“早期”細(xì)胞表現(xiàn)出明顯的高表達(dá)CD69和CD24膀值,CD62L的表達(dá)較低(圖4f;P<1×10?6误辑,Kolmogorov-Smirnov檢驗(yàn))沧踏,表明“早期”和“晚期”的細(xì)胞分別是不成熟和成熟的。對(duì)于CD4和CD8分支中的附加門控群體的類似結(jié)果(補(bǔ)充圖12)表明巾钉,傳統(tǒng)門控方案導(dǎo)致在每個(gè)門中包含不同成熟階段的細(xì)胞翘狱。我們的結(jié)論是,Wishbone提供了更可靠的細(xì)胞成熟度估計(jì)砰苍,因此標(biāo)記動(dòng)力學(xué)沿著SP成熟潦匈。
為了了解這種差異的來源阱高,我們比較了免疫基因組計(jì)劃(ImmGen)分類人群中標(biāo)記物的平均基因表達(dá)量16和Wishbone標(biāo)記物動(dòng)力學(xué),并且我們的門控群體中的平均蛋白表達(dá)量和ImmGen群體中的平均mRNA表達(dá)量是相關(guān)的茬缩。因此赤惊,沿叉形桿軌跡觀察到的動(dòng)力學(xué)與選通之間的差異不是特定于數(shù)據(jù)集的觀察(圖4g)。在每個(gè)門中發(fā)育不同的細(xì)胞的混合可能會(huì)導(dǎo)致在成熟過程中表達(dá)改變模式的混雜效應(yīng)寒屯。盡管CD24沿著叉骨軌跡呈持續(xù)下降趨勢,但在門控和ImmGen群體中表達(dá)的變化更大(圖4g黍少,左圖)寡夹。在門控群體中,由于CD69本身用于門控(圖4g厂置,右圖)菩掏,所以在門控細(xì)胞群中沒有觀察到CD69的持續(xù)上調(diào)。最后昵济,盡管Gata3沒有用于選通(補(bǔ)充圖12g)智绸,但Gata3在選通群體中的表達(dá)變化并未顯示在Wishbone中觀察到的動(dòng)態(tài)(圖4c(1,5))访忿,進(jìn)一步證明了Wishbone在更高分辨率下恢復(fù)標(biāo)記動(dòng)態(tài)的能力瞧栗。
2.6 Wishbone在人髓系發(fā)育中的應(yīng)用
我們?cè)趦蓚€(gè)人類髓系發(fā)育數(shù)據(jù)集上評(píng)估了Wishbone的性能。我們使用了先前發(fā)表的流式細(xì)胞術(shù)數(shù)據(jù)[2]海铆,這些數(shù)據(jù)包括適合于恢復(fù)早期和晚期髓樣分叉的標(biāo)記物[17]迹恐,但不適用于過渡性髓樣細(xì)胞群的精細(xì)分析。
Wishbone能夠跟蹤造血干細(xì)胞和祖細(xì)胞(hematopoietic stem and progenitor cells, HSPCs)的單核細(xì)胞(CD14+CD11b+CD11c+)和紅系細(xì)胞(CD235ab+)的分化(圖5a和補(bǔ)充圖14a)卧斟,并精確地恢復(fù)單核細(xì)胞和紅系分支(圖5a)殴边。此外,沿著軌跡的標(biāo)記的表達(dá)與已知文獻(xiàn)18一致(補(bǔ)充圖14c)珍语。
Wishbone精確地恢復(fù)了從HSPCs開始的軌跡锤岸,以及兩類單核細(xì)胞的分支,經(jīng)典單核細(xì)胞和CD16單核細(xì)胞(CD16+CD15+)(圖5b)板乙。這是一個(gè)更困難的問題是偷,因?yàn)槌颂卣鳂?biāo)記CD15和CD16(補(bǔ)充圖14d),大多數(shù)標(biāo)記在兩個(gè)群體之間顯示相同的分布募逞。標(biāo)記沿著軌跡的表達(dá)與已知文獻(xiàn)一致(補(bǔ)充圖14e)晓猛,檢測到的分叉點(diǎn)與CD38的顯著下調(diào)一致。
2.7 Wishbone擴(kuò)展到單細(xì)胞RNA序列數(shù)據(jù)
單細(xì)胞RNA序列技術(shù)可以描繪數(shù)千個(gè)單細(xì)胞凡辱,并能夠?qū)φ诎l(fā)育的系統(tǒng)進(jìn)行全基因組鑒定戒职。然而,這些數(shù)據(jù)帶來了挑戰(zhàn)透乾,因?yàn)樵S多基因的行為與發(fā)育成熟度無關(guān)洪燥,而是與細(xì)胞周期和壓力等過程有關(guān)磕秤。因此,軌跡和分支檢測的成功依賴于去除不相關(guān)的因素捧韵,并保留那些具有差異性的跟蹤因素市咆。
我們使用最近發(fā)表的單細(xì)胞RNA序列數(shù)據(jù),從HSPC中選擇參與髓系和紅系祖細(xì)胞分化的細(xì)胞(圖5c和補(bǔ)充圖15a)芒篷。我們?cè)O(shè)計(jì)了一個(gè)Wishbone的擴(kuò)展搜变,適用于單細(xì)胞RNA序列,它使用擴(kuò)散圖來幫助關(guān)注與發(fā)育和成熟相關(guān)的成分针炉。擴(kuò)散圖捕捉數(shù)據(jù)中的主要結(jié)構(gòu)和趨勢挠他,在流式細(xì)胞儀的情況下,不同的擴(kuò)散成分跟蹤組成細(xì)胞類型之間的差異(補(bǔ)充圖6a)篡帕。我們將基因投射到每個(gè)擴(kuò)散組分上殖侵,根據(jù)基因在這個(gè)組分上的表達(dá)情況對(duì)基因進(jìn)行排序,然后用這個(gè)排序進(jìn)行基因集富集分析(GSEA)镰烧。一些擴(kuò)散組分被富集用于免疫相關(guān)功能(例如拢军,防御反應(yīng)、抗原處理和吞噬作用)怔鳖,而其他組分被富集用于其他生物過程(例如朴沿,細(xì)胞周期、核糖體生物發(fā)生和代謝過程)(補(bǔ)充圖15c败砂,在線方法)赌渣。這為保留與差異化過程最相關(guān)的組件提供了一種自然的方法〔蹋基于類似的推理坚芜,Buettner等人21使用潛在變量模型來消除單細(xì)胞RNA序列中細(xì)胞周期的貢獻(xiàn)。
我們構(gòu)建了Wishbone的鄰域圖铸敏,該圖只基于將數(shù)據(jù)投影到與分化相關(guān)的組分上缚忧,一旦該圖被構(gòu)建,我們就按照流式細(xì)胞儀的方法繼續(xù)進(jìn)行Wishbone的操作杈笔。Wishbone精確地恢復(fù)了從HSPCs開始到兩個(gè)前體細(xì)胞類型和分支聯(lián)系的軌跡(圖5c)闪水。標(biāo)記趨勢顯示HSPC標(biāo)記物CD34沿著軌跡持續(xù)減少,髓系標(biāo)記物Mpo22沿髓系分支的表達(dá)增加(補(bǔ)充圖15c)蒙具。與已知生物學(xué)一致球榆,Gata2在Gata1之前沿著紅系23上調(diào)(圖5d)朽肥。
2.7 Wishbone在軌跡識(shí)別和分支識(shí)別方面都優(yōu)于競爭方法
我們比較了Wishbone與Diffusion maps[7],SCUBA[5]和Monocle[24]的性能(圖6)持钉。盡管我們使用擴(kuò)散圖構(gòu)建了kNN圖衡招,但我們測試了擴(kuò)散圖是否可以概括發(fā)展軌跡。請(qǐng)注意每强,擴(kuò)散貼圖并未明確提供分叉始腾,我們只能評(píng)估其概括準(zhǔn)確排序的能力。擴(kuò)散圖正確地恢復(fù)了T細(xì)胞發(fā)育的各個(gè)已知階段(補(bǔ)充圖16b)空执,尤其是在早期的DN浪箭,但是在DP和SP群體中卻缺乏足夠的分辨率(補(bǔ)充圖16a,b)脆烟。 此外山林,盡管擴(kuò)散圖在兩個(gè)髓樣數(shù)據(jù)集(補(bǔ)充圖16c房待,e)中恢復(fù)了正確的順序邢羔,但在單核細(xì)胞數(shù)據(jù)集中,擴(kuò)散圖對(duì)成熟細(xì)胞之后的前體進(jìn)行了排序(補(bǔ)充圖16d)桑孩。 因此拜鹤,盡管擴(kuò)散圖大大減少了數(shù)據(jù)中的噪聲(補(bǔ)充圖1,在線方法)流椒,但Wishbone采取的細(xì)化細(xì)胞順序的額外步驟對(duì)于得出魯棒的高分辨率軌跡至關(guān)重要敏簿。
接下來,我們將Wishbone與SCUBA進(jìn)行了比較宣虾。SCUBA具有較大的內(nèi)存占用空間惯裕,因此只能通過從胸腺數(shù)據(jù)集中對(duì)20,000個(gè)單元進(jìn)行二次采樣來運(yùn)行。胸腺的SCUBA軌跡未正確排序各階段绣硝,我們觀察到了不同的DN細(xì)胞散布在DP細(xì)胞之間(圖6a)蜻势。 SCUBA確實(shí)將兩個(gè)SP種群確定為兩個(gè)分支,但與Wishbone相比鹉胖,在分叉點(diǎn)的分辨率降低了(圖6a)握玛。而且,不同的隨機(jī)細(xì)胞樣本在軌跡和分支方面都導(dǎo)致不一致的結(jié)果(補(bǔ)充圖17a甫菠,c)挠铲。大量細(xì)胞計(jì)數(shù)單核細(xì)胞和單細(xì)胞RNA-Seq髓系數(shù)據(jù)集中的SCUBA軌跡與已知生物學(xué)一致,但產(chǎn)生了大量不連貫的分支(圖6c和補(bǔ)充圖17d)寂诱。 此外拂苹,SCUBA無法正確恢復(fù)單核-紅系數(shù)據(jù)集中的順序和分支(補(bǔ)充圖17e)。
最后痰洒,我們將Wishbone與Monocle24進(jìn)行了比較醋寝,Monocle是專為應(yīng)用于單細(xì)胞RNA-Seq數(shù)據(jù)而開發(fā)的搞挣。Monocle不能運(yùn)行超過1,000個(gè)單元,因此我們從每個(gè)數(shù)據(jù)集中對(duì)1,000個(gè)單元進(jìn)行了二次采樣音羞。 在散布著DN和DP細(xì)胞的情況下囱桨,Monocle無法恢復(fù)胸腺數(shù)據(jù)中的正確順序(圖6b)。 盡管軌跡確實(shí)終止于兩個(gè)SP種群嗅绰,但Monocle鑒定出的分支并不對(duì)應(yīng)于T細(xì)胞發(fā)育的任何特定階段舍肠,并且兩個(gè)SP種群都被確定為同一分支的一部分(圖6b)。 重復(fù)的數(shù)據(jù)二次抽樣導(dǎo)致兩個(gè)SP種群被重復(fù)分配到同一分支的結(jié)果大體上不一致(補(bǔ)充圖18a–c)窘面。Monocle還無法通過錯(cuò)誤的細(xì)胞排序和缺乏連貫分支的檢測來恢復(fù)單細(xì)胞RNA-Seq髓系數(shù)據(jù)集中的軌跡和分支(圖6d)翠语。單核細(xì)胞確實(shí)恢復(fù)了單核細(xì)胞數(shù)據(jù)集中的排序,但所有髓樣數(shù)據(jù)集中的分支結(jié)果均不對(duì)應(yīng)于正確的成熟細(xì)胞群(補(bǔ)充圖18d财边,e)肌括。
因此,Wishbone在細(xì)胞的精細(xì)排序酣难,分支點(diǎn)和分支關(guān)聯(lián)的識(shí)別以及復(fù)制間一致的魯棒性方面優(yōu)于競爭方法谍夭。
3.討論
我們已經(jīng)開發(fā)了一種算法,該算法能夠沿著分支的發(fā)展軌跡對(duì)細(xì)胞進(jìn)行精確且高分辨率的排序(補(bǔ)充圖19)憨募。 我們首先使用大規(guī)模流式細(xì)胞儀的通量收集每個(gè)樣品中≥200,000個(gè)細(xì)胞紧索,證明了Wishbone對(duì)小鼠胸腺T細(xì)胞發(fā)育的影響。Wishbone構(gòu)造了從DN階段到兩個(gè)SP譜系成熟的分叉軌跡菜谣,提供了事件的順序和時(shí)機(jī)珠漂,這些事件和事件的時(shí)間緊緊概述了該系統(tǒng)的先前研究15。 Wishbone的高分辨率使我們能夠識(shí)別譜系標(biāo)記的細(xì)微但關(guān)鍵的動(dòng)力學(xué)尾膊,例如在DN向DP細(xì)胞過渡期間檢測稀有CD8 + CD4-中間SP細(xì)胞以及向DP末端過渡CD4 + / CD8low中間狀態(tài)媳危。
選擇一個(gè)好的標(biāo)記集是我們獲得分辨率的關(guān)鍵。 可以通過先驗(yàn)知識(shí)和初步篩選的組合來指導(dǎo)標(biāo)記的選擇冈敛。 但是待笑,在骨髓分支中,我們證明了即使只有有限的面板(僅包含少量可區(qū)分的骨髓標(biāo)志物)莺债,Wishbone仍能正確排序細(xì)胞滋觉,識(shí)別分叉以及將細(xì)胞關(guān)聯(lián)至正確的分支。 盡管不一定可以提供明確的事實(shí)依據(jù)齐邦,但SCUBA和Monocle都無法在這些更具挑戰(zhàn)性的數(shù)據(jù)集中恢復(fù)與已知生物學(xué)一致的表達(dá)趨勢和分支椎侠。Wishbone只需要幾個(gè)規(guī)范標(biāo)記就可以正確地識(shí)別分叉,并且由于包含了其他標(biāo)記措拇,因此在過渡人群中獲得了越來越精細(xì)的分辨率我纪。
單細(xì)胞RNA-Seq是大規(guī)模流式細(xì)胞術(shù)的一種有吸引力的替代方法,因?yàn)槠錈o偏見的,全基因組的性質(zhì)提供了數(shù)千種基因的測量浅悉,并且避免了對(duì)先驗(yàn)選擇有限標(biāo)記集的需求趟据。 但是,與發(fā)育無關(guān)的轉(zhuǎn)錄變化會(huì)混淆分析术健,甚至與發(fā)育相關(guān)的基因的數(shù)據(jù)也具有很大的噪音汹碱,包括脫落效應(yīng)27。 我們使用擴(kuò)散圖鞏固了關(guān)鍵的生物學(xué)趨勢荞估,并刪除了不相關(guān)的生物學(xué)過程咳促。 我們證明,橫臂骨大大優(yōu)于專門為單細(xì)胞RNA-Seq數(shù)據(jù)開發(fā)的方法5勘伺。
即使單細(xì)胞RNA-Seq的吞吐率不斷提高跪腹,目前的數(shù)據(jù)集仍包含數(shù)千個(gè)細(xì)胞,而大規(guī)模細(xì)胞計(jì)數(shù)法中卻有數(shù)十萬個(gè)細(xì)胞飞醉。 由于已顯示出過渡種群與1 / 10,000個(gè)細(xì)胞一樣稀少3冲茸,因此大規(guī)模細(xì)胞計(jì)數(shù)的通量更適合于實(shí)現(xiàn)更精細(xì)的時(shí)間分辨率。 我們認(rèn)為缅帘,這兩種技術(shù)是互補(bǔ)的轴术。 例如,單細(xì)胞RNA-Seq可以用于研究較少的發(fā)育系統(tǒng)中的無偏標(biāo)記選擇股毫,然后可以使用已鑒定的專家組通過大規(guī)模細(xì)胞術(shù)獲得更精細(xì)的時(shí)間分辨率膳音。