作者:Jenny
審稿:童蒙
編輯:angelica
近幾年來(lái)泳赋,單細(xì)胞測(cè)序技術(shù)一直是討論熱度極其高的話題,除了單細(xì)胞轉(zhuǎn)錄組腕让,單細(xì)胞ATAC也逐漸引起科研人員的興趣晦墙。那么悦昵,它與我們熟知的單細(xì)胞轉(zhuǎn)錄組又有什么相同和不同之處呢?單細(xì)胞ATAC基礎(chǔ)分析軟件晌畅、亞群分析但指、motif&擬時(shí)間等高級(jí)分析與單細(xì)胞轉(zhuǎn)錄組又有哪些異同點(diǎn)?在這里抗楔,今天這篇分享主要是給大家介紹下單細(xì)胞ATAC的基本知識(shí)點(diǎn)棋凳,后續(xù)也會(huì)給大家?guī)?lái)更多關(guān)于單細(xì)胞ATAC生信分析的內(nèi)容,盡請(qǐng)期待谓谦。
什么是單細(xì)胞ATAC贫橙?
第一個(gè)單細(xì)胞ATAC數(shù)據(jù)是2015年由Greenleaf(Buenrostro, Wu et al. 2015)和Shendure(Cusanovich, Daza et al. 2015)實(shí)驗(yàn)室的分別發(fā)布Nature和Science期刊上,他們通過(guò)修改ATAC-seq protocal獲取了幾百~上萬(wàn)個(gè)細(xì)胞反粥。其中Greenleaf實(shí)驗(yàn)室Nature文章中是依賴(lài)物理隔離單細(xì)胞(右圖)卢肃,而Shendure實(shí)驗(yàn)室避免了單細(xì)胞反應(yīng)體積使用兩步組合索引策略(左圖)(Pott and Lieb 2015)。
簡(jiǎn)單來(lái)說(shuō)才顿,單細(xì)胞ATAC是單細(xì)胞技術(shù)和傳統(tǒng)ATAC-seq的結(jié)合體莫湘。我們知道,ATAC-seq(Assay for Transposase-Accessible Chromatin with highthroughput sequencing)是一種利用轉(zhuǎn)座酶(改造后Tn5轉(zhuǎn)座酶)來(lái)研究全基因組范圍內(nèi)染色質(zhì)開(kāi)放性的方法郑气,而基于2018年大火的10x Genomics ChromiumTM平臺(tái)的Single Cell ATAC產(chǎn)品同樣也是利用乳狀液凝膠珠GEM來(lái)獲取單細(xì)胞的幅垮。
從這里我們可以看出,單細(xì)胞ATAC和單細(xì)胞轉(zhuǎn)錄組的實(shí)驗(yàn)建庫(kù)有一個(gè)很明顯的差異尾组,那就是忙芒,單細(xì)胞轉(zhuǎn)錄組是必須要活體細(xì)胞示弓,且是提取細(xì)胞胞質(zhì)里的RNA序列,而單細(xì)胞ATAC是提取核內(nèi)DNA呵萨,對(duì)細(xì)胞的狀態(tài)要求較低奏属。
為什么要進(jìn)行單細(xì)胞ATAC研究?
細(xì)胞是生命活動(dòng)的基本單位潮峦,而要弄清楚真核生物的基礎(chǔ)機(jī)制囱皿,只查看基因的表達(dá)水平是往往不夠的。有研究表明忱嘹,人類(lèi)全基因組70%的范圍可以發(fā)生轉(zhuǎn)錄(像lncRNA嘱腥、small RNA、eRNA等)拘悦,而單細(xì)胞轉(zhuǎn)錄組更多是檢測(cè)基因coding區(qū)域齿兔,這一區(qū)域占比不到5%。此外真核生物中還存在大量的順式調(diào)控元件窄做,在細(xì)胞發(fā)育過(guò)程中愧驱,遠(yuǎn)端的非編碼區(qū)域的表觀狀態(tài)往往比基因表達(dá)水平的變化要大得多慰技,而單細(xì)胞ATAC技術(shù)就是實(shí)現(xiàn)這一目標(biāo)的可靠手段之一椭盏。
我們可以簡(jiǎn)單總結(jié)單細(xì)胞ATAC的特點(diǎn):
- 細(xì)胞更容易獲取,制備簡(jiǎn)單吻商,研究范圍較廣掏颊。
- 可以觀測(cè)到細(xì)胞全基因組表觀ATAC的整體變化。
- 可以做TF, motif轉(zhuǎn)錄調(diào)控方面的研究艾帐。
如何要進(jìn)行單細(xì)胞ATAC研究乌叶?
如今,比較流行的是10x Genome單細(xì)胞平臺(tái)柒爸,目前官方已推出2款關(guān)于單細(xì)胞ATAC的產(chǎn)品准浴,一個(gè)是Single Cell ATAC;另一個(gè)是去年剛推出的Single Cell Multiome ATAC + Gene Expression 捎稚。
后者是可以同時(shí)檢測(cè)同一個(gè)細(xì)胞的ATAC信號(hào)和轉(zhuǎn)錄組水平(核內(nèi)RNA)乐横。此外10x也配套發(fā)布了相應(yīng)的cellrange分析軟件,分別是Cell Ranger ATAC和Cell Ranger ARC今野。
單細(xì)胞ATAC基礎(chǔ)數(shù)據(jù)葡公?
01 單細(xì)胞ATAC基礎(chǔ)數(shù)據(jù)介紹
單細(xì)胞ATAC跟單細(xì)胞轉(zhuǎn)錄組在數(shù)據(jù)格式類(lèi)型上有比較明顯的區(qū)別,不像單細(xì)胞轉(zhuǎn)錄組条霜,經(jīng)過(guò)cellranger分析后只需要基因表達(dá)矩陣就行催什。單細(xì)胞ATAC的基礎(chǔ)依賴(lài)數(shù)據(jù)是每個(gè)樣本有一個(gè)fragments.tsv文件(已經(jīng)去掉duplicates),每一行代表一個(gè)unique read(fragment)宰睡,并且有對(duì)應(yīng)細(xì)胞barcode信息蒲凶。我們可以利用這個(gè)文件得到peaks矩陣信息气筋,但是fragments.tsv文件我們后期還是會(huì)用到(比如畫(huà)track圖等)。
02 單細(xì)胞ATAC基礎(chǔ)數(shù)據(jù)獲取
接下來(lái)旋圆,我們以10x Genome的Single Cell ATAC數(shù)據(jù)為例裆悄,說(shuō)明如何從原始fastq文件得到下游單細(xì)胞ATAC的基礎(chǔ)數(shù)據(jù)信息。
Cell Ranger ATAC是由10xGenomics官網(wǎng)提供的一組分析臂聋、處理光稼,單細(xì)胞ATAC數(shù)據(jù)的流程軟件。Cell Ranger ATAC主要包括四個(gè)與單細(xì)胞染色質(zhì)可及性分析相關(guān)的pipeline: mkref(建庫(kù))孩等、count(數(shù)據(jù)分析)艾君、aggr和reanalyze。目前官方cellranger-atac已更新到1.2.0版本肄方。
參考官方pipeline教程:https://support.10xgenomics.com/single-cell-atac/software/pipelines/
運(yùn)行
cellranger-atac count
命令冰垄,便可獲取我們的基礎(chǔ)文件。以下是下游分析需要用到的重要文件列表权她。有時(shí)候我們會(huì)做多個(gè)樣本多個(gè)組的單細(xì)胞數(shù)據(jù)虹茶,而一些軟件,比如Signac是要依賴(lài)peaks matrix作為輸入文件的隅要,這時(shí)候我們可以用
cellranger-atac aggr
共同call 多個(gè)樣本的peaks matrix蝴罪。
- Tips:peak作為feature跟基因不一樣,同一基因的位置信息都是一樣的步清,但是每個(gè)樣本的peak具體位置不一要门,且有時(shí)候即便是同一個(gè)peak,但是它們的start,end會(huì)有少許bp偏差廓啊,這時(shí)候就需要定義多個(gè)樣本的統(tǒng)一peak位置信息欢搜。
以下是cellranger-atac count/ aggr
具體命令:
#單個(gè)樣本,多個(gè)制備文庫(kù)
cellranger-atac count --id=sample_name --fastqs=QC/clean/sample_name --sample s1,s2,s3,s4 --reference=10xATAC_genome --localcores=20 --localmem=60 --dim-reduce=lsa
#多個(gè)樣本谴轮,共同call peaks,因計(jì)算量大且運(yùn)行時(shí)間長(zhǎng)炒瘟,不建議做下游分析(nosecondary)
cellranger-atac aggr --nosecondary --id=Rice --csv=test_aggr.csv --normalize=depth --reference=10xATAC_genome
以下是后續(xù)做亞群分析要用到的test_aggr.csv基礎(chǔ)文件列表,包含以下具體信息:
- 1)library_id:樣本名
- 2)fragments:cellrangeATAC的輸出結(jié)果第步,同一目錄下必須要有對(duì)應(yīng)的*gz.tbi index文件疮装。
假設(shè)網(wǎng)上下載的數(shù)據(jù),沒(méi)有*gz.tbi index文件或者是需要根據(jù)genomeAnnotation,geneAnnotation對(duì)象修改一致的Chr等命名雌续,可以按照以下方式修改fragments重新生成tabix index斩个。
#必須用bgzip,不能用gzip
bgzip -c fragments.tsv > fragments.tsv.gz
#生成tabix index
tabix -0 -p bed fragments.tsv.gz
-
3)cells:cellrangeATAC的輸出結(jié)果驯杜,對(duì)應(yīng)每個(gè)cell的barcode等信息受啥。
今天關(guān)于單細(xì)胞ATAC的基礎(chǔ)知識(shí)點(diǎn)介紹就到這里。獲得了基礎(chǔ)數(shù)據(jù)后,那么接下來(lái)就是做亞群分析了滚局。
下次居暖,我會(huì)繼續(xù)給大家?guī)?lái)比較詳細(xì)的有關(guān)單細(xì)胞ATAC生信的分析內(nèi)容了。不要走開(kāi)喔~
參考資料
- Buenrostro JD, Wu B, Litzenburger UM, Ruff D, Gonzales ML, Snyder MP,et al. Single-cell chromatin accessibility reveals principles of regulatory variation. Nature. 2015;523:486–90. #Greenleaf(Buenrostro, Wu et al. 2015)實(shí)驗(yàn)室
- Cusanovich DA, Daza R, Adey A, Pliner HA, Christiansen L, Gunderson KL, et al. Epigenetics. Multiplex single-cell profiling of chromatin accessibility by combinatorial cellular indexing. Science. 2015;348:910–4. https://doi.org/10.1038/nature14590 #Shendure(Cusanovich, Daza et al. 2015)實(shí)驗(yàn)室
- Pott, S. & Lieb, J. D. Single-cell ATAC-seq: strength in numbers. Genome biology 16, 172, doi:10.1186/s13059-015-0737-7 (2015). #這篇文章比較了Greenleaf和Shendure兩個(gè)實(shí)驗(yàn)室文章的側(cè)重點(diǎn)
- Minnoye, L., G. K. Marinov, T. Krausgruber, L. Pan, A. P. Marand, S. Secchia, W. J. Greenleaf, E. E. M. Furlong, K. Zhao, R. J. Schmitz, C. Bock and S. Aerts (2021). "Chromatin accessibility profiling methods." Nature Reviews Methods Primers 1(1). #Nature review, 比較系統(tǒng)介紹了單細(xì)胞ATAC
- https://support.10xgenomics.com/single-cell-atac/ #10x ATAC官方網(wǎng)站藤肢,cellranger-atac-1.2.0
- Cell Ranger ATAC 1.0, 1.1 and 1.2 support libraries generated by the Chromium Single Cell ATAC v1 reagent kits.
- https://support.10xgenomics.com/single-cell-multiome-atac-gex #Single Cell Multiome ATAC + Gene Expression 官方網(wǎng)站太闺,Cell Ranger ARC
- https://github.com/seandavi/awesome-single-cell #單細(xì)胞數(shù)據(jù)分析的軟件列表,包含scRNA和scATAC等嘁圈。
- Chen, H., C. Lareau, T. Andreani, M. E. Vinyard, S. P. Garcia, K. Clement, M. A. Andrade-Navarro, J. D. Buenrostro and L. Pinello (2019). "Assessment of computational methods for the analysis of single-cell ATAC-seq data." Genome Biol 20(1): 241. #整體介紹scATAC分析流程