單細(xì)胞ATAC概述

作者:Jenny
審稿:童蒙
編輯:angelica

近幾年來(lái)泳赋,單細(xì)胞測(cè)序技術(shù)一直是討論熱度極其高的話題,除了單細(xì)胞轉(zhuǎn)錄組腕让,單細(xì)胞ATAC也逐漸引起科研人員的興趣晦墙。那么悦昵,它與我們熟知的單細(xì)胞轉(zhuǎn)錄組又有什么相同和不同之處呢?單細(xì)胞ATAC基礎(chǔ)分析軟件晌畅、亞群分析但指、motif&擬時(shí)間等高級(jí)分析與單細(xì)胞轉(zhuǎn)錄組又有哪些異同點(diǎn)?在這里抗楔,今天這篇分享主要是給大家介紹下單細(xì)胞ATAC的基本知識(shí)點(diǎn)棋凳,后續(xù)也會(huì)給大家?guī)?lái)更多關(guān)于單細(xì)胞ATAC生信分析的內(nèi)容,盡請(qǐng)期待谓谦。

什么是單細(xì)胞ATAC贫橙?

第一個(gè)單細(xì)胞ATAC數(shù)據(jù)是2015年由Greenleaf(Buenrostro, Wu et al. 2015)和Shendure(Cusanovich, Daza et al. 2015)實(shí)驗(yàn)室的分別發(fā)布Nature和Science期刊上,他們通過(guò)修改ATAC-seq protocal獲取了幾百~上萬(wàn)個(gè)細(xì)胞反粥。其中Greenleaf實(shí)驗(yàn)室Nature文章中是依賴(lài)物理隔離單細(xì)胞(右圖)卢肃,而Shendure實(shí)驗(yàn)室避免了單細(xì)胞反應(yīng)體積使用兩步組合索引策略(左圖)(Pott and Lieb 2015)。


圖1:?jiǎn)渭?xì)胞ATAC測(cè)序技術(shù)(Pott and Lieb 2015)

簡(jiǎn)單來(lái)說(shuō)才顿,單細(xì)胞ATAC是單細(xì)胞技術(shù)和傳統(tǒng)ATAC-seq的結(jié)合體莫湘。我們知道,ATAC-seq(Assay for Transposase-Accessible Chromatin with highthroughput sequencing)是一種利用轉(zhuǎn)座酶(改造后Tn5轉(zhuǎn)座酶)來(lái)研究全基因組范圍內(nèi)染色質(zhì)開(kāi)放性的方法郑气,而基于2018年大火的10x Genomics ChromiumTM平臺(tái)的Single Cell ATAC產(chǎn)品同樣也是利用乳狀液凝膠珠GEM來(lái)獲取單細(xì)胞的幅垮。

從這里我們可以看出,單細(xì)胞ATAC和單細(xì)胞轉(zhuǎn)錄組的實(shí)驗(yàn)建庫(kù)有一個(gè)很明顯的差異尾组,那就是忙芒,單細(xì)胞轉(zhuǎn)錄組是必須要活體細(xì)胞示弓,且是提取細(xì)胞胞質(zhì)里的RNA序列,而單細(xì)胞ATAC是提取核內(nèi)DNA呵萨,對(duì)細(xì)胞的狀態(tài)要求較低奏属。

為什么要進(jìn)行單細(xì)胞ATAC研究?

細(xì)胞是生命活動(dòng)的基本單位潮峦,而要弄清楚真核生物的基礎(chǔ)機(jī)制囱皿,只查看基因的表達(dá)水平是往往不夠的。有研究表明忱嘹,人類(lèi)全基因組70%的范圍可以發(fā)生轉(zhuǎn)錄(像lncRNA嘱腥、small RNA、eRNA等)拘悦,而單細(xì)胞轉(zhuǎn)錄組更多是檢測(cè)基因coding區(qū)域齿兔,這一區(qū)域占比不到5%。此外真核生物中還存在大量的順式調(diào)控元件窄做,在細(xì)胞發(fā)育過(guò)程中愧驱,遠(yuǎn)端的非編碼區(qū)域的表觀狀態(tài)往往比基因表達(dá)水平的變化要大得多慰技,而單細(xì)胞ATAC技術(shù)就是實(shí)現(xiàn)這一目標(biāo)的可靠手段之一椭盏。


圖2:?jiǎn)渭?xì)胞ATAC揭示候選調(diào)控區(qū)域(Minnoye, Marinov et al. 2021)

我們可以簡(jiǎn)單總結(jié)單細(xì)胞ATAC的特點(diǎn):

  • 細(xì)胞更容易獲取,制備簡(jiǎn)單吻商,研究范圍較廣掏颊。
  • 可以觀測(cè)到細(xì)胞全基因組表觀ATAC的整體變化。
  • 可以做TF, motif轉(zhuǎn)錄調(diào)控方面的研究艾帐。

如何要進(jìn)行單細(xì)胞ATAC研究乌叶?

如今,比較流行的是10x Genome單細(xì)胞平臺(tái)柒爸,目前官方已推出2款關(guān)于單細(xì)胞ATAC的產(chǎn)品准浴,一個(gè)是Single Cell ATAC;另一個(gè)是去年剛推出的Single Cell Multiome ATAC + Gene Expression 捎稚。
后者是可以同時(shí)檢測(cè)同一個(gè)細(xì)胞的ATAC信號(hào)和轉(zhuǎn)錄組水平(核內(nèi)RNA)乐横。此外10x也配套發(fā)布了相應(yīng)的cellrange分析軟件,分別是Cell Ranger ATAC和Cell Ranger ARC今野。


圖3:10x Genome單細(xì)胞ATAC產(chǎn)品

單細(xì)胞ATAC基礎(chǔ)數(shù)據(jù)葡公?

01 單細(xì)胞ATAC基礎(chǔ)數(shù)據(jù)介紹

單細(xì)胞ATAC跟單細(xì)胞轉(zhuǎn)錄組在數(shù)據(jù)格式類(lèi)型上有比較明顯的區(qū)別,不像單細(xì)胞轉(zhuǎn)錄組条霜,經(jīng)過(guò)cellranger分析后只需要基因表達(dá)矩陣就行催什。單細(xì)胞ATAC的基礎(chǔ)依賴(lài)數(shù)據(jù)是每個(gè)樣本有一個(gè)fragments.tsv文件(已經(jīng)去掉duplicates),每一行代表一個(gè)unique read(fragment)宰睡,并且有對(duì)應(yīng)細(xì)胞barcode信息蒲凶。我們可以利用這個(gè)文件得到peaks矩陣信息气筋,但是fragments.tsv文件我們后期還是會(huì)用到(比如畫(huà)track圖等)。


圖4:?jiǎn)渭?xì)胞ATAC基礎(chǔ)matrix處理流程(Chen, Lareau et al. 2019)

02 單細(xì)胞ATAC基礎(chǔ)數(shù)據(jù)獲取

接下來(lái)旋圆,我們以10x Genome的Single Cell ATAC數(shù)據(jù)為例裆悄,說(shuō)明如何從原始fastq文件得到下游單細(xì)胞ATAC的基礎(chǔ)數(shù)據(jù)信息。
Cell Ranger ATAC是由10xGenomics官網(wǎng)提供的一組分析臂聋、處理光稼,單細(xì)胞ATAC數(shù)據(jù)的流程軟件。Cell Ranger ATAC主要包括四個(gè)與單細(xì)胞染色質(zhì)可及性分析相關(guān)的pipeline: mkref(建庫(kù))孩等、count(數(shù)據(jù)分析)艾君、aggr和reanalyze。目前官方cellranger-atac已更新到1.2.0版本肄方。


參考官方pipeline教程:https://support.10xgenomics.com/single-cell-atac/software/pipelines/
運(yùn)行cellranger-atac count命令冰垄,便可獲取我們的基礎(chǔ)文件。以下是下游分析需要用到的重要文件列表权她。

有時(shí)候我們會(huì)做多個(gè)樣本多個(gè)組的單細(xì)胞數(shù)據(jù)虹茶,而一些軟件,比如Signac是要依賴(lài)peaks matrix作為輸入文件的隅要,這時(shí)候我們可以用cellranger-atac aggr共同call 多個(gè)樣本的peaks matrix蝴罪。

  • Tips:peak作為feature跟基因不一樣,同一基因的位置信息都是一樣的步清,但是每個(gè)樣本的peak具體位置不一要门,且有時(shí)候即便是同一個(gè)peak,但是它們的start,end會(huì)有少許bp偏差廓啊,這時(shí)候就需要定義多個(gè)樣本的統(tǒng)一peak位置信息欢搜。

以下是cellranger-atac count/ aggr具體命令:

#單個(gè)樣本,多個(gè)制備文庫(kù)
cellranger-atac count --id=sample_name --fastqs=QC/clean/sample_name --sample s1,s2,s3,s4 --reference=10xATAC_genome --localcores=20 --localmem=60 --dim-reduce=lsa
#多個(gè)樣本谴轮,共同call peaks,因計(jì)算量大且運(yùn)行時(shí)間長(zhǎng)炒瘟,不建議做下游分析(nosecondary)
cellranger-atac aggr --nosecondary --id=Rice --csv=test_aggr.csv --normalize=depth --reference=10xATAC_genome

以下是后續(xù)做亞群分析要用到的test_aggr.csv基礎(chǔ)文件列表,包含以下具體信息:

  • 1)library_id:樣本名
  • 2)fragments:cellrangeATAC的輸出結(jié)果第步,同一目錄下必須要有對(duì)應(yīng)的*gz.tbi index文件疮装。

假設(shè)網(wǎng)上下載的數(shù)據(jù),沒(méi)有*gz.tbi index文件或者是需要根據(jù)genomeAnnotation,geneAnnotation對(duì)象修改一致的Chr等命名雌续,可以按照以下方式修改fragments重新生成tabix index斩个。

#必須用bgzip,不能用gzip
bgzip -c fragments.tsv > fragments.tsv.gz
#生成tabix index
tabix -0 -p bed fragments.tsv.gz
  • 3)cells:cellrangeATAC的輸出結(jié)果驯杜,對(duì)應(yīng)每個(gè)cell的barcode等信息受啥。


今天關(guān)于單細(xì)胞ATAC的基礎(chǔ)知識(shí)點(diǎn)介紹就到這里。獲得了基礎(chǔ)數(shù)據(jù)后,那么接下來(lái)就是做亞群分析了滚局。
下次居暖,我會(huì)繼續(xù)給大家?guī)?lái)比較詳細(xì)的有關(guān)單細(xì)胞ATAC生信的分析內(nèi)容了。不要走開(kāi)喔~

參考資料

  • Buenrostro JD, Wu B, Litzenburger UM, Ruff D, Gonzales ML, Snyder MP,et al. Single-cell chromatin accessibility reveals principles of regulatory variation. Nature. 2015;523:486–90. #Greenleaf(Buenrostro, Wu et al. 2015)實(shí)驗(yàn)室
  • Cusanovich DA, Daza R, Adey A, Pliner HA, Christiansen L, Gunderson KL, et al. Epigenetics. Multiplex single-cell profiling of chromatin accessibility by combinatorial cellular indexing. Science. 2015;348:910–4. https://doi.org/10.1038/nature14590 #Shendure(Cusanovich, Daza et al. 2015)實(shí)驗(yàn)室
  • Pott, S. & Lieb, J. D. Single-cell ATAC-seq: strength in numbers. Genome biology 16, 172, doi:10.1186/s13059-015-0737-7 (2015). #這篇文章比較了Greenleaf和Shendure兩個(gè)實(shí)驗(yàn)室文章的側(cè)重點(diǎn)
  • Minnoye, L., G. K. Marinov, T. Krausgruber, L. Pan, A. P. Marand, S. Secchia, W. J. Greenleaf, E. E. M. Furlong, K. Zhao, R. J. Schmitz, C. Bock and S. Aerts (2021). "Chromatin accessibility profiling methods." Nature Reviews Methods Primers 1(1). #Nature review, 比較系統(tǒng)介紹了單細(xì)胞ATAC
  • https://support.10xgenomics.com/single-cell-atac/ #10x ATAC官方網(wǎng)站藤肢,cellranger-atac-1.2.0
  • Cell Ranger ATAC 1.0, 1.1 and 1.2 support libraries generated by the Chromium Single Cell ATAC v1 reagent kits.
  • https://support.10xgenomics.com/single-cell-multiome-atac-gex #Single Cell Multiome ATAC + Gene Expression 官方網(wǎng)站太闺,Cell Ranger ARC
  • https://github.com/seandavi/awesome-single-cell #單細(xì)胞數(shù)據(jù)分析的軟件列表,包含scRNA和scATAC等嘁圈。
  • Chen, H., C. Lareau, T. Andreani, M. E. Vinyard, S. P. Garcia, K. Clement, M. A. Andrade-Navarro, J. D. Buenrostro and L. Pinello (2019). "Assessment of computational methods for the analysis of single-cell ATAC-seq data." Genome Biol 20(1): 241. #整體介紹scATAC分析流程
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末省骂,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子最住,更是在濱河造成了極大的恐慌钞澳,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件涨缚,死亡現(xiàn)場(chǎng)離奇詭異轧粟,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)脓魏,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)兰吟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人茂翔,你說(shuō)我怎么就攤上這事混蔼。” “怎么了檩电?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵拄丰,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我俐末,道長(zhǎng),這世上最難降的妖魔是什么奄侠? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任卓箫,我火速辦了婚禮,結(jié)果婚禮上垄潮,老公的妹妹穿的比我還像新娘烹卒。我一直安慰自己,他們只是感情好弯洗,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布旅急。 她就那樣靜靜地躺著,像睡著了一般牡整。 火紅的嫁衣襯著肌膚如雪藐吮。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 48,970評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音谣辞,去河邊找鬼迫摔。 笑死,一個(gè)胖子當(dāng)著我的面吹牛泥从,可吹牛的內(nèi)容都是我干的句占。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼躯嫉,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼纱烘!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起祈餐,我...
    開(kāi)封第一講書(shū)人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤凹炸,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后昼弟,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體啤它,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年舱痘,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了变骡。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡芭逝,死狀恐怖塌碌,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情旬盯,我是刑警寧澤台妆,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布,位于F島的核電站胖翰,受9級(jí)特大地震影響接剩,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜萨咳,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一懊缺、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧培他,春花似錦鹃两、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至猛遍,卻和暖如春馋记,著一層夾襖步出監(jiān)牢的瞬間号坡,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工抗果, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留筋帖,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓冤馏,卻偏偏與公主長(zhǎng)得像日麸,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子逮光,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容