sc-ATAC-seq細胞類型注釋策略

解釋任何單細胞測序數據的起點都是對給定數據集中的細胞簇進行注釋。由于缺乏專門設計的工具以及在單細胞ATAC-seq數據中使用不直觀的順式和跨式調控元素(unintuitive cis- and trans-regulatory )谆沃,因此單細胞ATAC-seq數據中的細胞類型標注具有挑戰(zhàn)性锯岖。本技術說明探索并演示了三種不同的策略介袜,這些策略對于在單個細胞ATAC-seq數據中標注細胞類型所需的生物信息學專業(yè)知識的數量有所不同。

人骨髓單核細胞(BMMCs)和熒光激活細胞分選(FACS)富集CD34+造血祖細胞(AllCells)出吹,按照10x方案——單細胞ATAC測序的細胞核分離(文獻CG000169)進行處理遇伞。單細胞ATAC文庫按照《10X單細胞試劑試劑盒使用指南》(文檔CG000168)編寫,按每個細胞2 -5萬個原始reads進行測序捶牢。測序數據通過cellranger-atac count (v1.1.0)管道進行處理鸠珠,使用cellranger-atac aggr管道整合BMMCs和CD34+細胞數據巍耗。

下面概述的細胞類型注釋策略是單細胞ATAC-seq數據中可能的細胞類型注釋方法,不是cell Ranger ATAC軟件的一部分渐排。

Strategy 1. Annotation Using Cis-Regulatory Elements

使用Loupe cell Browser 3.1.1分析10321個bmmc和9084個CD34+細胞的ATAC-seq單胞數據炬太。對CD34+祖細胞、CD4+ T細胞驯耻、CD8+/NK細胞亲族、B細胞、單核細胞/樹突狀細胞進行細胞類型標記基因啟動子可及性模式的可視化標記(圖1)可缚。通過將 fragments.tsv.gz 加載到peak viewer并根據每個窗口的cell類型導出剪切站點分布霎迫,從而從Loupe中導出特定于cell類型的剪切站點。


使用啟動子注釋細胞類型帘靡。A.已知細胞類型的標記基因的啟動子可及性及后續(xù)的細胞類型注釋知给。顏色表示所選啟動子的log轉換計數,紅色=高值描姚。A.從Loupe Cell Browser中導出切割位點的序列文件涩赢。NK:自然殺傷細胞;Mono:單核細胞;DC:樹突細胞

Strategy 2: Annotation Using Cell Type-Specific Feature Set

第二種細胞類型注釋方法使用一組用戶定義的分子特征,包括細胞類型特異性峰值轩勘、細胞類型標記的基因激活分數或具有已知調控作用的轉錄因子的motif可達性筒扒。例如,為了使用細胞類型特定的峰值來注釋細胞類型赃阀,我們對來自10,321個bmmc和9,084個CD34+細胞的單個細胞ATAC-seq數據應用了一個評分方案霎肯,該方案計算了細胞類型特定的峰值在背景可達性水平上的富集情況。

一套統(tǒng)一策劃了130萬年的峰值Epinomics來自29個FACS-sorted免疫細胞類型定義這些細胞類型的ATAC資料,基于以前公布的數據(1)細胞特定類型的山峰被定義為前200名豐富峰所選的所有其他細胞類型的細胞類型榛斯。背景被定義為500組200個隨機選擇的峰值。生成最大富集分數的細胞類型被標注到細胞中(圖2)搂捧。



圖2驮俗。使用cell型特定的功能集來注釋。所選細胞類型的細胞類型富集評分分布允跑。B.在單細胞ATAC-seq數據中王凑,BMMCs + CD34+細胞中鑒定出19種主要的細胞類型。tSNE投影直接來自Cell Ranger ATAC管道聋丝。cell標簽的大小按每個類型的豐度進行顯示.

CLP: Common lymphoid progenitors
CMP: Common myeloid progenitor
DC: Dendritic cells
Ery: Erythroid
GMP: Granulocyte-macrophage progenitor
HSC: Hematopoietic stem cells
LMPP: Lympho-myeloid primed progenitor
MEP: Megakaryocyte-erythroid progenitor
Mono: Monocytes
MPPs: Multipotent progenitor cells
Neut: Neutrophills
NK: Natural killer cells

Strategy 3: Annotation Using RNA Sequencing Data as Reference

為了使用RNA-seq數據標注細胞類型索烹,使用Chromium單細胞ATAC溶液從胚胎和成年小鼠腦組織(見下文)中生成單細胞ATAC-seq數據。胚胎和成年小鼠腦組織的參考RNA-seq數據集來自于先前的研究(2,3)弱睦。Seurat v3.0和Signac包(4)用于將單個單元的ATAC-seq數據和單個單元的RNA-seq數據合并到一個共享的簡化維中莽使,并基于RNA-seq數據中預注釋單元的距離預測ATAC-seq數據的cell類型(圖3)侠畔。

Query (single cell ATAC)
?P50 adult mouse cortex (3,927 cells)
?E18.5 mouse cortex, hippocampus & ventricular zone (4,115 cells)

Reference (single cell RNA)
?P30-40 mouse primary visual cortex & anterior lateral motor cortex (21,814 cells)
?P0 mouse cortex (7,614 cells)


圖3。使用RNA-seq數據作為參考的注釋明也。使用預先注釋的RNA-seq數據注釋來自成年和胚胎小鼠皮層的ATAC-seq數據的UMAP圖分別顯示在A和C中。來自成年和新生小鼠皮層的預先注釋的RNA-seq數據的UMAP圖分別顯示在B和D中悦荒。該集成顯示了參考RNA-seq和ATAC-seq數據之間的大量重疊。在成年小鼠皮層中發(fā)現了20多種不同的細胞類型,在E18.5小鼠皮層組織中發(fā)現了18種主要的細胞類型奔垦。主要細胞類型在成體和胚狀體中的比例。

Validation of Cell Type Annotation Using RNA Sequencing Data as Reference
  • Validation Using Gene Activity Scores

為了驗證細胞類型注釋尸疆,我們使用了R package Cicero(5)來計算來自胚胎和成年小鼠組織的單個細胞ATAC-seq數據的基因活性(GA)評分椿猎。為了計算GA分數,峰至基因注釋和tSNE坐標(作為reduced_coordinates)直接從Cell Ranger ATAC輸出中獲得寿弱。使用strategy 3識別出的興奮性神經元鸵贬、抑制性神經元和各種膠質細胞類型的已知標記(圖3C),并對其進行檢查以確定正確的注釋(圖4A-B)脖捻。

UMAP單細胞投射的GA分數分布證實了策略3的結果阔逼。例如,胚胎期E18.5的神經元前體細胞標記Eomes的可達性高于成年期P50, SVZ區(qū)域富集較強(圖4A)地沮,驗證了策略3的結果嗜浮。

  • Validation Using Transcription Factor (TF) Deviation Scores

chromVAR(6)計算的轉錄因子(Transcription factor, TF)偏差分數可以測量TF活性,可以作為另一個驗證細胞類型標注的來源摩疑。為了測量全局TF活性危融,我們從Cell Ranger ATAC管道的TF-barcode矩陣中獲取輸入計數矩陣,并選擇JASPAR motif數據庫作為輸入motif數據庫雷袋。然后使用建議的chromVAR工作流計算策略3(圖3A)中來自成人組織的單個細胞ATAC-seq數據中識別的細胞類型的TF偏差分數(圖4C)吉殃。

細胞類型特異性轉錄因子,如星形膠質細胞中的Noto和小膠質細胞中的Spi1楷怒,在相應的細胞類型中表現出排他的活性(圖4C)蛋勺。抑制神經元亞型中Mef2c TF偏差分數的比較證實了之前關于Pvalb亞型中Mef2c活性升高的報道(7)


圖4。cell 注釋的驗證鸠删。A. E18.5 UMAP單細胞投射中的基因活性分布抱完。B. UMAP單細胞投射中P50基因活性分布。紅色陰影=高基因活性水平刃泡,灰色=啟動子和鄰近增強子檢測不到的可及性巧娱。C.按細胞類型劃分的成體TF活性。Y軸是轉錄因子活性評分烘贴,基于從chromVAR TF偏差z分數轉換而來的p值的-log10禁添。

討論

利用細胞類型特異性順式調控元件進行的細胞類型注釋顯示,在不同的細胞亞群中桨踪,啟動子的可及性明顯豐富老翘,從而可以識別骨髓單核細胞中的主要細胞類型。在pseudo-bulk profile 中,簇中的所有細胞都聚集成一個單一的軌跡酪捡,在基因標記啟動子附近的染色質可達性顯示了一個更復雜的模式叁征。如,CD4啟動子表現出多個富集峰逛薇,其中只有一個具有CD4+ t細胞特異性捺疼,而其他的高峰在單核細胞和干細胞群體中也表現出很強的可達性。

使用細胞類型特定的特征集對細胞類型進行注釋是對傳統(tǒng)的基于基因標記的策略的擴展永罚,在這種策略中啤呼,標記基因的列表被可解釋的特征集所取代,從而提供了合并批量數據呢袱、轉錄因子基序位點或預先注釋的基因集的靈活性官扣。精細的細胞類型注釋更詳細地說明了CD34+祖細胞群的子結構,包括多能干細胞群(HSC, MPP)和承諾譜系祖細胞(CMP)羞福。MEP惕蹄、GMP和CLP(圖2A-B)。先祖群體的子結構也可以與來自不同譜系的終末分化細胞相匹配治专,形成完整的發(fā)育軌跡卖陵,這一點在《應用注釋——用單細胞ATAC-Seq破譯表觀遺傳調控》(LIT000055)中得到了更詳細的探討。

這種無監(jiān)督的张峰、基于整合的策略將單個細胞的ATAC-seq數據嵌入到參考的單個細胞RNA-seq數據中泪蔫,并且不需要任何標記基因的先驗知識〈可以通過計算基因和轉錄因子活性評分來驗證注釋(圖4A-C)撩荣。基于集成的策略還可以擴展為任何類型的單細胞數據的注釋饶深。例如餐曹,可以使用預先注釋的單細胞RNA數據集輕松地對單細胞RNA-seq數據進行注釋。此外粥喜,整合的數據為描述增強子和目標基因之間的調控關系以及最終的基因調控網絡提供了一個起點凸主。

綜上所述,我們證明了針對單個細胞ATAC-seq數據的三種互補細胞類型注釋策略额湘。所選擇的cell 類型注釋方法將取決于對感興趣的示例類型或類似的示例類型可用的知識或數據。第一種策略是使用已知的cell類型標記旁舰,這是最簡單的锋华,并且可以在Loupe中很容易地顯示出來。第二和第三種策略需要額外的生物信息處理和互補的參考數據集(例如箭窜,批量ATAC-seq或單細胞RNA-seq)毯焕。

https://support.10xgenomics.com/single-cell-atac/index/doc/technical-note-cell-type-annotation-strategies-for-single-cell-atac-seq-data

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子纳猫,更是在濱河造成了極大的恐慌婆咸,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件芜辕,死亡現場離奇詭異尚骄,居然都是意外死亡,警方通過查閱死者的電腦和手機侵续,發(fā)現死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進店門倔丈,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人状蜗,你說我怎么就攤上這事需五。” “怎么了轧坎?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵宏邮,是天一觀的道長。 經常有香客問我缸血,道長蜜氨,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任属百,我火速辦了婚禮记劝,結果婚禮上,老公的妹妹穿的比我還像新娘族扰。我一直安慰自己厌丑,他們只是感情好,可當我...
    茶點故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布渔呵。 她就那樣靜靜地躺著怒竿,像睡著了一般。 火紅的嫁衣襯著肌膚如雪扩氢。 梳的紋絲不亂的頭發(fā)上耕驰,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天,我揣著相機與錄音录豺,去河邊找鬼朦肘。 笑死,一個胖子當著我的面吹牛双饥,可吹牛的內容都是我干的媒抠。 我是一名探鬼主播,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼咏花,長吁一口氣:“原來是場噩夢啊……” “哼趴生!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤苍匆,失蹤者是張志新(化名)和其女友劉穎刘急,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體浸踩,經...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡叔汁,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了民轴。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片攻柠。...
    茶點故事閱讀 39,688評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖后裸,靈堂內的尸體忽然破棺而出瑰钮,到底是詐尸還是另有隱情,我是刑警寧澤微驶,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布浪谴,位于F島的核電站,受9級特大地震影響因苹,放射性物質發(fā)生泄漏苟耻。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一扶檐、第九天 我趴在偏房一處隱蔽的房頂上張望凶杖。 院中可真熱鬧,春花似錦款筑、人聲如沸智蝠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽杈湾。三九已至,卻和暖如春攘须,著一層夾襖步出監(jiān)牢的瞬間漆撞,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工于宙, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留浮驳,地道東北人。 一個月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓捞魁,卻偏偏與公主長得像抹恳,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子署驻,可洞房花燭夜當晚...
    茶點故事閱讀 44,573評論 2 353

推薦閱讀更多精彩內容