單細胞分析雕刻師--常見整合方法比較(一)

Preface

隨著單細胞測序技術的迅猛發(fā)展和市場的不斷下沉,越來越多的研究人員都青睞于使用該技術來闡明一些生物學或醫(yī)學問題挥吵,使通過傳統(tǒng)bulk-RNA測序無法解決的事情得以實現(xiàn)成為可能,如細胞圖譜的繪制偿乖、稀有細胞的鑒定與識別冶伞、細胞發(fā)育/分化軌跡的構建、腫瘤的精細化研究等筑凫。與此同時,也產生了海量的單細胞數(shù)據(jù)并村,而這些數(shù)據(jù)通常來源于不同的實驗室巍实,具有不同的構建時間、不同的操作人員以及不同的試劑批次等等哩牍。上述差異往往會對數(shù)據(jù)的合并造成嚴重的影響棚潦,導致批次效應的出現(xiàn),進而干擾對真實的生物學效應的鑒別膝昆,因此丸边,如何將不同來源的數(shù)據(jù)完美地系在一起一直是一個復雜的、具有挑戰(zhàn)性的問題荚孵。在過去的十幾年間妹窖,有數(shù)十種數(shù)據(jù)整合方法相繼被開發(fā)出來,它們基于不同的原理或應用場景實現(xiàn)對數(shù)據(jù)的合并收叶,在保留生物學差異的同時盡可能地去除批次效應骄呼。這里,我們選擇了一些比較常見的工具或方法滔驾,包含ComBat谒麦、BBKNN、Seurat CCA哆致、Seurat RPCA绕德、Harmony、LIGER摊阀、fastMNN耻蛇、Conos踪蹬、Scanorama總共9種,通過應用于同一套數(shù)據(jù)對其進行比較臣咖。

Results

01?Preprocessing

對于每一個獨立的樣本跃捣,我們遵循 Seurat 標準分析流程進行預處理,并且依據(jù)已知的Marker基因和SingleR[1] 預測的細胞類型結果對其進行注釋夺蛇,然后將所有數(shù)據(jù)合并在一起疚漆,分別保存為RDS和Anndata對象以供后續(xù)使用。以其中一例樣本進行演示 (10x, pbmc_1k)刁赦。讀取數(shù)據(jù)創(chuàng)建Seurat對象娶聘,過濾表達基因數(shù)低于200、線粒體基因占比高于5%的細胞甚脉;然后對表達矩陣做標準化處理丸升,結合高變基因(HVGs, High Variable Genes)使用PCA降維,選取前20個主成分(PCs, Principal Components) 進行后續(xù)的聚類及可視化牺氨,并使用SingleR對細胞進行注釋狡耻;最后,結合已知的細胞特異性Marker進行注釋的校驗 (Figure1)猴凹。

Figure1 | pbmc_1k樣本聚類結果夷狰。上方圖片為按照聚類結果和注釋結果分組的UMAP降維圖形,下圖為Marker基因的表達熱圖精堕,列按照聚類結果分組


02?unIntegration

按照如上方法對每個樣本進行單獨處理孵淘,然后合并所有樣本蒲障。首先歹篓,我們在未矯正的情況下直接對數(shù)據(jù)進行分析,并按照不同的標簽進行分組揉阎,如數(shù)據(jù)來源庄撮、細胞類型等 (Figure2)。其中毙籽,為了方便理解及簡化后續(xù)分析洞斯,我們將細分的細胞類型簡單合并,例如?pre-B_cell_CD34- , pro-B_cell_CD34+?和?B cell?統(tǒng)稱為B細胞坑赡。

Figure2 | 未整合數(shù)據(jù)分布烙如。四張子圖分別為按照數(shù)據(jù)來源、聚類結果毅否、細分細胞類型亚铁、合并細胞類型分組的UMAP圖形展示
Figure3 | 未整合數(shù)據(jù)評分


03?Seurat CCA

首先使用Seurat-CCA[2]的方法進行數(shù)據(jù)整合。該方法主要通過CCA(Canonical Correlation Analysis) 來對原始數(shù)據(jù)進行降維處理并且捕獲其中的數(shù)據(jù)特征螟加,從而實現(xiàn)數(shù)據(jù)的對齊徘溢,減少批次效應的影響 (Figure4)吞琐。主要步驟包括使用CCA生成亞空間,然后在亞空間內識別互近鄰對然爆,最后將這些互近鄰對作為“錨點”來調整表達值站粟,返回一個矯正的基因表達矩陣。這里曾雕,我們選取了前3000個HVGs奴烙,通過函數(shù) Seurat::FindIntegrationAnchors(reduction='cca') 計算錨點,然后通過 Seurat::IntegrateData 整合數(shù)據(jù)剖张,輸出的結果用于進一步的分析和繪圖缸沃。

Figure4 | Seurat整合流程模式圖。參考數(shù)據(jù)和查詢數(shù)據(jù)共享一組類似細胞修械,通過CCA及L2正則化得到相關向量趾牧,映射在共享亞空間中,在該空間內鑒定MNN細胞對并且賦分肯污,最后計算每個細胞的矯正向量用于轉換表達數(shù)據(jù)
Figure5 | Seurat-CCA 整合分析結果翘单。左邊為UMAP降維圖形展示,分別以數(shù)據(jù)集和細胞類型分組蹦渣;右圖是結果評分

04?Seurat RPCA

接下來我們使用Seurat中另一種用于數(shù)據(jù)整合的方法——RPCA(Reciprocal PCA)哄芜,該方法使用RPCA而非CCA來識別數(shù)據(jù)集錨點。使用該方法確定任意數(shù)據(jù)集之間的錨點時柬唯,會將每個數(shù)據(jù)集投影到其他PCA空間中认臊。在分析上,Seurat-RPCA和Seurat-CCA并無太大區(qū)別锄奢。

Figure6| Seurat-RPCA 整合分析結果失晴。左邊為UMAP降維圖形展示,分別以數(shù)據(jù)集和細胞類型分組拘央;右圖是結果評分
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末涂屁,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子灰伟,更是在濱河造成了極大的恐慌拆又,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件栏账,死亡現(xiàn)場離奇詭異帖族,居然都是意外死亡,警方通過查閱死者的電腦和手機挡爵,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進店門佩伤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來懈涛,“玉大人默赂,你說我怎么就攤上這事≈坪洌” “怎么了?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵胞谭,是天一觀的道長垃杖。 經常有香客問我,道長丈屹,這世上最難降的妖魔是什么调俘? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮旺垒,結果婚禮上彩库,老公的妹妹穿的比我還像新娘。我一直安慰自己先蒋,他們只是感情好骇钦,可當我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著竞漾,像睡著了一般眯搭。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上业岁,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天鳞仙,我揣著相機與錄音,去河邊找鬼笔时。 笑死棍好,一個胖子當著我的面吹牛,可吹牛的內容都是我干的允耿。 我是一名探鬼主播借笙,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼右犹!你這毒婦竟也來了提澎?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤念链,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后积糯,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體掂墓,經...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年看成,在試婚紗的時候發(fā)現(xiàn)自己被綠了君编。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡川慌,死狀恐怖吃嘿,靈堂內的尸體忽然破棺而出祠乃,到底是詐尸還是另有隱情,我是刑警寧澤兑燥,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布亮瓷,位于F島的核電站,受9級特大地震影響降瞳,放射性物質發(fā)生泄漏嘱支。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一挣饥、第九天 我趴在偏房一處隱蔽的房頂上張望除师。 院中可真熱鬧,春花似錦扔枫、人聲如沸汛聚。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽贞岭。三九已至,卻和暖如春搓侄,著一層夾襖步出監(jiān)牢的瞬間瞄桨,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工讶踪, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留芯侥,地道東北人。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓乳讥,卻偏偏與公主長得像柱查,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子云石,可洞房花燭夜當晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內容