Spatial mapping of cell types by integration of transcriptomics data
眾所周知,目前的空間轉(zhuǎn)錄組技術(shù)還沒有達(dá)到單細(xì)胞水平抖韩,所以還不能叫做空間單細(xì)胞轉(zhuǎn)錄組技術(shù)。以10X Visium 為例,每個(gè)spots 中的細(xì)胞數(shù)量在10的某個(gè)領(lǐng)域內(nèi):
空間轉(zhuǎn)錄組芯片上含有上千個(gè)捕獲的spot,這些捕獲探針的 Poly-T 尾可以結(jié)合RNA分子的 Poly-A 尾。這些陣列的排列順序就像一個(gè)棋盤角骤,帶有相同身份條形碼(barcode)的探測(cè)位于同一個(gè)正方形中投蝉。這樣就可以確定每個(gè)捕獲探針及其結(jié)合RNA的來源养葵。
如何借助這兩項(xiàng)技術(shù)的優(yōu)勢(shì),把空間和單細(xì)胞數(shù)據(jù)關(guān)聯(lián)到一起分析呢瘩缆?我想這個(gè)充滿機(jī)遇的世界里面已經(jīng)有人這樣做了关拒,這就是與10X 空間流程發(fā)布的同一天發(fā)表的這篇文章。
空間轉(zhuǎn)錄組學(xué)和單細(xì)胞rna測(cè)序?qū)D(zhuǎn)錄表達(dá)格局提供了互補(bǔ)的見解庸娱。我們?cè)谶@里提出了一種概率方法着绊,它集成了來自這兩種技術(shù)的數(shù)據(jù),利用它們各自的優(yōu)勢(shì)熟尉,使我們能夠在空間上將細(xì)胞類型映射到組織空間信息上去归露。該方法適用于幾種不同類型的組織,并成功地描繪出細(xì)胞的空間形態(tài)斤儿。
他們使用的方法如下
- 選擇帶注釋的單細(xì)胞數(shù)據(jù)和一組具有相似細(xì)胞類型內(nèi)容的ST數(shù)據(jù)進(jìn)行分析剧包。
-
由單細(xì)胞數(shù)據(jù)估計(jì)出表征該表達(dá)的負(fù)二項(xiàng)分布的參數(shù)腮考,第一個(gè)參數(shù)(比率,(the rate))取決于基因和細(xì)胞類型玄捕,第二個(gè)參數(shù)(成功概率踩蔚, (the success probability) )只取決于基因。
-
估計(jì)參數(shù)用于推斷每個(gè)spot細(xì)胞類型的比例枚粘。
+細(xì)胞類型的空間組織是可視化的馅闽,通過讓每個(gè)點(diǎn)的臉顏色的不透明度代表比例值。
給一個(gè)例子馍迄, 利用gt-SNE包埋(內(nèi)區(qū))可視化單細(xì)胞海馬數(shù)據(jù)福也,在mb-B樣本的h&e圖像(外區(qū))上疊加多個(gè)簇的空間比例估計(jì)(10x)
Visium陣列,55微米斑點(diǎn))攀圈。亞群標(biāo)簽派生自原始的單細(xì)胞數(shù)據(jù)集(方法)暴凑。
在小鼠大腦單細(xì)胞數(shù)據(jù)集中定義的56個(gè)簇中的3個(gè)簇(這里作為細(xì)胞類型)的估計(jì)比例。使用mb-A (ST陣列赘来,100微米點(diǎn))和mb-B兩個(gè)不同的部分來說明不同陣列分辨率之間的一致性现喳。通過ISH獲得的標(biāo)記基因表達(dá)模式見于最下面一行,取自艾倫大腦圖譜犬辰。Rarres2是室管膜細(xì)胞的標(biāo)記基因嗦篱,Prox1為齒狀顆粒神經(jīng)元和錐體神經(jīng)元的Wfs1(后兩者都是神經(jīng)元的亞型)
整個(gè)算法以及流程已經(jīng)發(fā)布在github上了。