seurat發(fā)展歷史田轧,cns之路
在單細(xì)胞數(shù)據(jù)分析中舔糖,特別是對初學(xué)者來說帮毁,Seurat是一個教科書級別的工具酌摇。至于這個用來分析單細(xì)胞多組學(xué)的工具為什么叫這個名字瀑志,我想汁果,與它問世的第一篇文獻(xiàn)不無關(guān)系:
-
Satija, Farrell, et al., Nat Biotechnol 2015 [Seurat V1]
Satija, R., Farrell, J., Gennert, D. et al. Spatial reconstruction of single-cell gene expression data. Nat Biotechnol 33, 495–502 (2015). https://doi.org/10.1038/nbt.3192
這篇文章的第一作者Rahul Satija和作者Aviv Regev成為日后單細(xì)胞領(lǐng)域人們耳熟能詳?shù)拿峙韧鳶eurat是一位畫家的名字:
喬治·修拉(Georges Seurat驶赏,1859-1891)耕驰,1859年12月2日生于巴黎爷辱,受過完整的美術(shù)學(xué)院教育,曾師從安格爾的學(xué)生亨利·萊曼(Henri Lehmann)學(xué)習(xí)古典主義繪畫朦肘,后來又研究過 盧浮宮中的大師作品饭弓,對光學(xué)和色彩理論特別關(guān)注并為之做了大量的實驗。他的畫作風(fēng)格相當(dāng)與眾不同媒抠,Seurat的畫充滿了細(xì)膩繽紛的小點弟断,當(dāng)你靠近看,每一個點都充滿著理性的筆觸领舰,與梵高的狂野夫嗓,還有塞尚的色塊都大為不同迟螺。把文藝復(fù)興傳統(tǒng)的古典結(jié)構(gòu)和印象主義的色彩試驗結(jié)合起來。Seurat擅長畫都市中的風(fēng)景畫舍咖,也擅長將色彩理論套用到畫作當(dāng)中矩父。把最新的繪畫空間概念、傳統(tǒng)的幻象透視空間排霉、以及在色彩和光線的知覺方面的最新科學(xué)發(fā)現(xiàn)結(jié)合起來窍株。
而這也是一篇描繪空間分析的單細(xì)胞文章NBT。我們知道攻柠,空間定位是細(xì)胞命運和行為的關(guān)鍵決定因素球订,但在復(fù)雜組織中,空間解析瑰钮、轉(zhuǎn)錄組范圍內(nèi)基因表達(dá)譜的方法還缺乏冒滩。RNA染色方法只檢測少量轉(zhuǎn)錄本,而測量基因表達(dá)的scRNA-seq將細(xì)胞從其固有的空間環(huán)境中分離出來浪谴。正式在這篇文章中开睡,Seurat以一個附件的形式面世了,Seurat一種通過整合單細(xì)胞RNA-seq數(shù)據(jù)和原位RNA模式來推斷細(xì)胞定位的計算策略苟耻。
這里的幾個附件都值得讀一讀篇恒,如Supplementary Text and Figures中講述了空間分析的大部分關(guān)鍵點也給出了第一套Seurat教程:
在這個意義上,Serurat是為空間分析而生的凶杖。然后為了我們更好地理解Seurat胁艰,第一版的源代碼我們還是需要拜讀一下的:
Seurat_Source\seurat.R
Seurat_Source\seuratFxns.R
Seurat_Source\zfRenderSeurat.R
在2021年的Seurat的更新日志中,我們中不到SeuratV1的信息智蝠,這個日志是從Seurat 2.0.0開始記錄的腾么。V2是Seurat功能和形象的一大轉(zhuǎn)折和重新定型,盡管保留了空間分析的功能杈湾,但更多地是轉(zhuǎn)向單細(xì)胞多組學(xué)數(shù)據(jù)的整合分析哮翘。
-
Butler* et al., Nat Biotechnol 2018 [Seurat V2]
Butler, A., Hoffman, P., Smibert, P. et al. Integrating single-cell transcriptomic data across different conditions, technologies, and species. Nat Biotechnol 36, 411–420 (2018). https://doi.org/10.1038/nbt.4096
隨著單細(xì)胞測序通量和緯度的提升,識別跨多個數(shù)據(jù)集(實驗條件毛秘、技術(shù)平臺饭寺、不同物種)的細(xì)胞亞群成為一個挑戰(zhàn)。Seurat V2基于公共變異源(common sources of variation)集成scRNA-seq數(shù)據(jù)集的分析策略叫挟,允許跨數(shù)據(jù)集識別共享種群并進(jìn)行下游比較分析艰匙。這即是日后人們在做數(shù)據(jù)整合(Integration)時說到的CCA的方法實現(xiàn)途徑。
-
Stuart, Butler, et al., Cell 2019 [Seurat V3]
僅僅一年之后抹恳,在整合海量單細(xì)胞數(shù)據(jù)這條路上员凝,Seurat越走越遠(yuǎn),隨著單細(xì)胞數(shù)據(jù)解析的組織類型越來越多奋献,僅僅用Seurat的CCA還是有很多數(shù)據(jù)集無法整合到一起健霹。于是旺上,整合力度更大的算法出現(xiàn)了,策略也有所變化:直接以一個作為reference另一個作為query糖埋。這個概念像極了基因組數(shù)據(jù)分析中常用的mapping宣吱、alignment、blast瞳别。
單細(xì)胞轉(zhuǎn)錄組學(xué)已經(jīng)改變了我們描述細(xì)胞狀態(tài)的能力征候,但深入的生物學(xué)理解需要的不僅僅是亞群的分類。隨著測量不同細(xì)胞模式技術(shù)的出現(xiàn)祟敛,一個關(guān)鍵的分析挑戰(zhàn)是整合這些數(shù)據(jù)集疤坝,以更好地了解細(xì)胞的身份和功能。Seurat V3將不同的數(shù)據(jù)集“錨定”在一起馆铁,使我們不僅能夠集成跨scRNA-seq技術(shù)的單細(xì)胞測量跑揉,而且能夠集成跨不同模式的單細(xì)胞測量。
-
Hao, Hao, et al., bioRxiv 2020 [Seurat V4]
2020年10月埠巨,紐約基因組所( New York Genome Center )的 Satija Lab團(tuán)隊開發(fā)的單細(xì)胞分析工具Seurat升級到了4.0畔裕,其特性之一是開發(fā)了加權(quán)鄰近(weighted-nearest neighbor,WNN)算法來分析多模態(tài)數(shù)據(jù)乖订。所謂多模態(tài)(multimodal )是指同時在一個細(xì)胞內(nèi)測量分屬于(廣義?)中心法則不同過程的特征(如具练,RNA乍构,ATAC,膜蛋白等)扛点。
seurat引用情況哥遮,技術(shù)快風(fēng)
與2017年以來的Seurat的快速更新同時發(fā)生的是,單細(xì)胞技術(shù)的快速應(yīng)用與普及陵究。簡單的幾行命令可以看出眠饮,2021年以來,大部分時間铜邮,一日之內(nèi)就有上千人下載和和安裝Seurat:
# install.packages("cranlogs")
library(cranlogs)
tail(Seuratdl <- cran_downloads(from = "2017-08-01", to= "2021-06-01", packages = c("Seurat")))
date count package
1396 2021-05-27 1441 Seurat
1397 2021-05-28 1101 Seurat
1398 2021-05-29 499 Seurat
1399 2021-05-30 487 Seurat
1400 2021-05-31 1022 Seurat
1401 2021-06-01 1316 Seurat
plot(Seuratdl$date,Seuratdl$count)
seurat開發(fā)
Seurat的廣泛應(yīng)用既反映了單細(xì)胞組學(xué)的熱度仪召,也說明Seurat團(tuán)隊在開源這件是上做的很好。github上每天都有人提問交流松蒜,開發(fā)者也是其中的積極參與者扔茅。讓我們簡單回顧一下這個R包的發(fā)展史,感受一下時間的力量秸苗。
正式因為對單細(xì)胞數(shù)據(jù)分析有著深刻的理解和與用戶的廣泛交流召娜,Seurat單細(xì)胞數(shù)據(jù)分析工具箱日漸完善。成為大部分入門單細(xì)胞數(shù)據(jù)分析的首選工具惊楼。Seurat不僅教程豐富玖瘸,還附有大量可以直接練習(xí)分析的數(shù)據(jù)集和對其他工具的友好接口秸讹,如Velocity、LIGER雅倒、Monocle3璃诀、Harmony、alevin屯断、Nebulosa等文虏。
seurat數(shù)據(jù)結(jié)構(gòu),可擴(kuò)展殖演,數(shù)據(jù)管理
既然定位于初學(xué)者氧秘,或者說是單細(xì)胞探索性數(shù)據(jù)分析工具,那我們就來看看Seurat在除了質(zhì)控趴久,降維聚類丸相,差異分析,整合分析之外一個十分重要的功能:數(shù)據(jù)管理彼棍。
基于R語言的S4結(jié)構(gòu)灭忠,Seurat構(gòu)建了一個以表達(dá)矩陣為核心的單細(xì)胞多組學(xué)數(shù)據(jù)結(jié)構(gòu)。這樣座硕,一個Seurat其實就是一個study的實驗設(shè)計弛作。
這個數(shù)據(jù)結(jié)構(gòu)也是大部分剛接觸R語言的同學(xué)最容易困惑的:
- 為什么函數(shù)輸入的是Seurat對象,輸出的也還是Seurat呢华匾?
- 降維的數(shù)據(jù)它是如何調(diào)用的呢映琳?數(shù)據(jù)又藏在哪里呢?
- 更多找不到
開啟你的seurat之旅蜘拉,最短入門路徑
最短入門路徑是:
- 安裝R語言
- 安裝Seurat
- 安裝SeuratData
- 打開Seurat網(wǎng)頁
- 練習(xí)單細(xì)胞數(shù)據(jù)分析
- 分析自己課題組的數(shù)據(jù)
- 發(fā)表文獻(xiàn)時引用Seurat
- 寫自己的SeuratWrappers包
先練習(xí)再分析萨西,先用SeurtData的數(shù)據(jù)集練習(xí)教程理解單細(xì)胞分析中的概念和Seurat的數(shù)據(jù)分析結(jié)構(gòu)。
- Seurat Weekly NO.0 || 開刊詞
- Seurat Weekly NO.1 || 到底分多少個群是合適的旭旭?谎脯!
- Seurat Weekly NO.2 || 我該如何取子集
- Seurat Weekly NO.3 || 直接用Seurat畫fig2
- Seurat Weekly NO.4 || 高效數(shù)據(jù)管理
- Seurat Weekly NO.5 pseudocell該如何計算||或談Seurat的擴(kuò)展
- Seurat Weekly NO.06 || 數(shù)據(jù)對象轉(zhuǎn)化之Scanpy2Seurat
- Seurat Weekly NO.07 || V4 新特性
- Seurat Weekly NO.08 || Seurat 交互系統(tǒng)
https://satijalab.org/seurat/
https://satijalab.org/seurat/news/index.html