Seurat4.0|| 單細胞多模態(tài)數(shù)據(jù)分析啟示錄

前情回顧

Seurat 4.0 ||單細胞數(shù)據(jù)分析工具箱有更新
Seurat 4.0 ||單細胞多模態(tài)數(shù)據(jù)整合算法WNN
Seurat 4.0 || 分析scRNA和表面抗體數(shù)據(jù)
Seurat 4.0 || WNN整合scRNA和scATAC數(shù)據(jù)
Seurat 4.0 || 單細胞PBMC多模態(tài)參考數(shù)據(jù)集
Seurat 4.0 || 單細胞BMNC多模態(tài)參考數(shù)據(jù)集
Seurat教程上新||Mixscape : 用多模態(tài)單細胞數(shù)據(jù)篩選免疫檢查點

2020年10月蟀淮,紐約基因組所( New York Genome Center )的 Satija Lab團隊開發(fā)的單細胞分析工具Seurat升級到了4.0,其特性之一是開發(fā)了加權鄰近(weighted-nearest neighbor鸦概,WNN)算法來分析多模態(tài)數(shù)據(jù)阀蒂。所謂多模態(tài)(multimodal )是指同時在一個細胞內(nèi)測量分屬于(廣義暖释?)中心法則不同過程的特征(如坏瞄,RNA蚂会,ATAC,膜蛋白等)作岖。直觀地說唆垃,這可以從多個側(cè)面反映細胞的真實狀態(tài)五芝,也會進一步細化我們對細胞行為與狀態(tài)的理解痘儡,這對我們研究生命發(fā)育、疾病形成的重要作用是不言而喻的枢步。我們知道沉删,如果是單一模態(tài)的數(shù)據(jù),如RNA醉途,只是一個側(cè)面矾瑰;如果只是獨立研究,如分別研究RNA和膜蛋白隘擎,許多時候不能很好的相互解釋殴穴。在單細胞面前我們都是貪玩的孩子,不能只摸到象牙就說這是根筷子货葬。

Seurat 4.0 提出WNN是在這樣的考慮之下的采幌,重要的是目前的技術已經(jīng)允許我們同時測量多模態(tài)數(shù)據(jù)了,如CITE-seq可以同時測得RNA和表面蛋白震桶,2020年10X公司也推出了同時測RNA和ATAC的商業(yè)解決方案休傍,空轉(zhuǎn)(ST)2019年也已經(jīng)面市。數(shù)據(jù)產(chǎn)生需要新的數(shù)學框架來整合他們蹲姐。

WNN算法細節(jié)以及應用實例可以在Satija Lab團隊的(預印本)文章Integrated analysis of multimodal single-cell data中查看閱讀磨取。本文是在學習Seurat 4.0 教程之后的體會,以饗關心單細胞技術發(fā)展的華語同行柴墩。謬誤在所難免忙厌,承蒙斧正,不勝感激江咳。

不變

Seurat的框架基本是沒變的慰毅。這對單細胞數(shù)據(jù)分析來說是一件好事,因為我們遇到過糟糕的情況:除了R包名字沒變之外扎阶,一切都變了的情況汹胃。如monocle的2和3,與其說是不同版本不如說是不同的R包了东臀。熟悉Seurat v3的同行應該能夠平穩(wěn)地過渡到Seurat v4着饥。雖然引入了大量的新功能,但v3的工作流程惰赋、函數(shù)和語法宰掉,可視化方案在這次更新中基本沒有變化呵哨。此外,以前在Seurat v3中生成的Seurat對象可以無縫地裝載到Seurat v4中以進行進一步分析轨奄。

有一點提示下孟害,這幾乎是語義上的:“整合”。Seurat V3 一度被認為是整合(Integrate挪拟,CCA+MNN)不同RNA數(shù)據(jù)集的標桿工具挨务,在其文章Comprehensive Integration of Single-Cell Data中提到:Seurat v3引入了集成多個單細胞數(shù)據(jù)集的新方法。這些方法的目的是識別存在于不同數(shù)據(jù)集的共享的細胞狀態(tài)玉组,即使它們是從不同的個體谎柄、實驗條件、技術平臺甚至物種惯雳,用到的函數(shù)是FindIntegrationAnchors朝巫。業(yè)內(nèi)有不少拿它和去批次的工具在一起做benchmark,其實這不是一回事石景。強調(diào)劈猿,整合與批次不是一回事。在V4 中整合不同的RNA數(shù)據(jù)集你依然可以用‘FindIntegrationAnchors’潮孽。在V4的WNN中也有一個“整合”揪荣,這里的整合多為多模態(tài)數(shù)據(jù)之間的整合,用到的函數(shù)FindMultiModalNeighbors恩商”涮樱可見,這個函數(shù)在v3中對應的位置應該是FindNeighbors怠堪,即構建細胞間的圖結(jié)構用的部分揽乱。

我們可以用pacman包來看看新舊版本有哪些函數(shù)的變化。

packageVersion("Seurat")
[1] '3.9.9.9005'

library(pacman)
v4fun<-p_functions("Seurat")
setdiff(v4fun,v3fun) # 我存的v3的所有函數(shù)

 [1] ".__C__IntegrationAnchorSet" ".__C__ModalityWeights"      ".__C__TransferAnchorSet"    "CalcPerturbSig"            
 [5] "DEenrichRPlot"              "FindMultiModalNeighbors"    "FindSubCluster"             "FoldChange"                
 [9] "Graphs"                     "IntegrateEmbeddings"        "MappingScore"               "MapQuery"                  
[13] "MixscapeHeatmap"            "MixscapeLDA"                "NNPlot"                     "PlotPerturbScore"          
[17] "PredictAssay"               "PrepLDA"                    "ProjectUMAP"                "RunLDA"                    
[21] "RunMixscape"                "RunSPCA"        
幾多

看了預印本的文章Integrated analysis of multimodal single-cell data之后覺得WNN簡直就是單細胞界的統(tǒng)一場論:可以把單細胞內(nèi)的隱藏表達矩陣都可以整合到一個Seurat對象中粟矿,偉大凰棉。但是在重現(xiàn)了V4的教程之后,特別是看到教程RNA+膜蛋白和教程RNA+ATAC是分開的之后陌粹,覺得V4沒有那么激進:不是一個教程同時整合RNA+ 膜蛋白+ ATAC+空轉(zhuǎn)撒犀。這也許不是算法上的,而是技術上的:目前還沒有技術可以這么測√椭龋現(xiàn)階段WNN的定位應該是為【scRNA+】提供解決方案或舞。

幾才算多呢?

在WNN中所謂的加權主要是給不同模態(tài)的數(shù)據(jù)以不同的權重蒙幻,比如RNA和膜蛋白中映凳,膜蛋白的權重要高一些,因為它更接近真實狀態(tài)(RNA不容易看到邮破?)诈豌。在算法中仆救,多模態(tài)數(shù)據(jù)可以看作是一個多分類的過程,如果把每一個模態(tài)看作我們對細胞的一層感知機矫渔,多模態(tài)就是多層感知機(機器學習的同行看過來)彤蔽。隨著模態(tài)的增加,就像我們提示過的:要以數(shù)據(jù)庫的思維來理解單細胞數(shù)據(jù)庙洼。

又如本文的封面所述顿痪,在單細胞技術的早期,數(shù)據(jù)分析像一本精裝書(Hardcover)很精美很細致送膳,每個技術的進步都帶來驚喜员魏。隨著數(shù)據(jù)的積累丑蛤,成本的降低叠聋,技術普及,特別是多模態(tài)技術的發(fā)展受裹,要把多模態(tài)的數(shù)據(jù)解釋清楚也就愈發(fā)需要生物學的知識碌补,此時的單細胞數(shù)據(jù)分析就像一本簡裝書(Paperback):可能需要一個團隊來讀。這也是我們一直主張的:建立自己的單細胞數(shù)據(jù)分析團隊棉饶。

啟示錄

單細胞技術本身是在NGS技術基本成熟條件下發(fā)展出來的厦章,所以數(shù)據(jù)可以超指數(shù)增長;NGS的測序和生信大部分可以擴展到單細胞水平上照藻,所以獲得數(shù)據(jù)和分析工具并不難袜啃。單細胞數(shù)據(jù)分析可以快速入門,一如某上聯(lián)所述:降維聚類必知必會幸缕。但是群发,當我們把單細胞數(shù)據(jù)分析的物理要素(數(shù)據(jù),服務器发乔,軟件)配齊后熟妓,我們依然面臨:數(shù)據(jù)如何挖,故事如何講的科學問題栏尚。多模態(tài)技術的發(fā)展起愈,對生物學背景提出了進一步的要求。之前的scRNA數(shù)據(jù)译仗,就是表達量咯抬虽,不管是均一化,標準化纵菌,表達量高的還是高的阐污,低的還是低的,一聚類产艾,高的和高的在一起疤剑。如果你是一個數(shù)據(jù)科學家滑绒,翻開自己工具箱,很容易去分析單細胞數(shù):一個矩陣而已隘膘。但是疑故,RNA和ATAC可不是直接比較表達量就可以的呀,這時候弯菊,打開工具箱纵势,還需要另一個裝滿生物學問題的急救包。

一如前蘇聯(lián)百科全書式的教授柳比歇夫所比喻的:蠕蟲那么長管钳,人生啊可是那么短钦铁!在這里,我驚嘆:單細胞那么大才漆,宇宙可是那么小呀牛曹!

亞歷山大·亞歷山德羅維奇·柳比歇夫(1890年4月5日--1972年8月31日),前蘇聯(lián)的昆蟲學家醇滥、哲學家黎比、數(shù)學家。畢業(yè)于圣彼得堡國立大學鸳玩,一生發(fā)布了70余部學術著作阅虫,從分散分析、生物分類學到昆蟲學等不跟。業(yè)余時間研究地蚤的分類颓帝,還寫過不少科學回憶錄。 各種各樣的論文和專著窝革,他一共寫了五百多印張购城。五百印張,等于一萬二千五百張打字稿聊闯。即使以專業(yè)作家而論工猜,這也是個龐大的數(shù)字。他不顧政治迫害菱蔬,做了大量工作來反對和批評當時屬于蘇聯(lián)生物遺傳學主流的李森科主義篷帅。還應用數(shù)學方法來研究生物分類學。感興趣可以讀一本小書:《奇特的一生》拴泌。


https://www.njtierney.com/post/2017/10/27/change-pkg-name/
https://r-pkgs.org/namespace.html

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末魏身,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子蚪腐,更是在濱河造成了極大的恐慌箭昵,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件回季,死亡現(xiàn)場離奇詭異家制,居然都是意外死亡正林,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進店門颤殴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來觅廓,“玉大人,你說我怎么就攤上這事涵但¤境瘢” “怎么了?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵矮瘟,是天一觀的道長瞳脓。 經(jīng)常有香客問我,道長澈侠,這世上最難降的妖魔是什么劫侧? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮埋涧,結(jié)果婚禮上板辽,老公的妹妹穿的比我還像新娘奇瘦。我一直安慰自己棘催,他們只是感情好,可當我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布耳标。 她就那樣靜靜地躺著醇坝,像睡著了一般。 火紅的嫁衣襯著肌膚如雪次坡。 梳的紋絲不亂的頭發(fā)上呼猪,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天,我揣著相機與錄音砸琅,去河邊找鬼宋距。 笑死,一個胖子當著我的面吹牛症脂,可吹牛的內(nèi)容都是我干的谚赎。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼诱篷,長吁一口氣:“原來是場噩夢啊……” “哼壶唤!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起棕所,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤闸盔,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后琳省,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體迎吵,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡躲撰,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了击费。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片茴肥。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖荡灾,靈堂內(nèi)的尸體忽然破棺而出瓤狐,到底是詐尸還是另有隱情,我是刑警寧澤批幌,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布础锐,位于F島的核電站,受9級特大地震影響荧缘,放射性物質(zhì)發(fā)生泄漏皆警。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一截粗、第九天 我趴在偏房一處隱蔽的房頂上張望信姓。 院中可真熱鬧,春花似錦绸罗、人聲如沸意推。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽菊值。三九已至,卻和暖如春育灸,著一層夾襖步出監(jiān)牢的瞬間腻窒,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工磅崭, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留儿子,地道東北人。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓砸喻,卻偏偏與公主長得像柔逼,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子恩够,可洞房花燭夜當晚...
    茶點故事閱讀 44,976評論 2 355