簡介
單細(xì)胞測序技術(shù)是近十年最偉大的科學(xué)進(jìn)展之一媒区,其涵蓋多方面的內(nèi)容。scRNA-seq想必大家都較為熟悉,但是scATAC-seq出現(xiàn)在大家印象中的次數(shù)并不多,但是這種現(xiàn)象并不是否定了scATAC的重要性用押,而是有幾個(gè)原因造成:1.相較于轉(zhuǎn)錄組測序,scATAC測序難度較高靶剑,在沒有多年積累的高水準(zhǔn)實(shí)驗(yàn)室之外是很難完成的蜻拨,很多一般的測序公司也很少開展這種項(xiàng)目;2.很多課題開展都是研究某一種細(xì)胞的功能抬虽,這樣bulk ATAC就能完成官觅,沒有必要測scATAC纵菌。但是同scRNAseq一樣阐污,高質(zhì)量的scATAC數(shù)據(jù),可以幫助我們鑒定特殊細(xì)胞亞群的調(diào)控機(jī)制咱圆,其價(jià)值也是十分重要的笛辟。今天Immugent就來和大家聊一下scATAC數(shù)據(jù)分析的工具,同出自Satija實(shí)驗(yàn)室Seurat的姊妹包--Signac.
Signac被開發(fā)出來已經(jīng)有段時(shí)日了序苏,網(wǎng)上也有很多教程手幢。小編之所以重新拾起來說一下是因?yàn)閷?duì)應(yīng)的文章在上個(gè)月發(fā)表在了nature methods(IF:28.55)雜志上,這篇文章系統(tǒng)的總結(jié)了這個(gè)包的功能忱详,而且配套的教程也更新了围来,之前的很多函數(shù)都不能使用了,所以Immugent決定來一波update。
下面小編以這篇文章為主要內(nèi)容來解讀一下Signac包的功能监透。
主要功能介紹
在Signac之前已經(jīng)有很多各式各樣分析scATAC的軟件了桶错,下圖列舉了它們之間功能的對(duì)比情況。其中功能最強(qiáng)大的一個(gè)軟件是ArchR,但是這個(gè)包特別難安裝胀蛮,而且因?yàn)榘姹镜膯栴}院刁,無法在4.1版本的R上使用。這個(gè)包雖然功能較為齊全粪狼,但使用起來非常笨重退腥,小編之前研究了很久這個(gè)包,最后決定還是放棄了再榄。
Signac包的流程相對(duì)簡潔狡刘,和Seurat包類似,是由相應(yīng)的函數(shù)構(gòu)成不跟。在處理數(shù)據(jù)中最大的區(qū)別是seurat讀入的是基因表達(dá)計(jì)數(shù)矩陣颓帝;而Signac讀入矩陣中的每一行代表一個(gè)基因組區(qū)域(“peak region”)而不是基因,其表示開放的染色質(zhì)區(qū)域窝革,矩陣中的每個(gè)值代表在每個(gè)峰內(nèi)映射的每個(gè)條形碼(即細(xì)胞)的Tn5切割位點(diǎn)的數(shù)量购城。
Signac能夠端到端分析scATAC數(shù)據(jù),包括peak calling, quantification, quality control, dimension reduction, clustering, integration with single-cell gene expression datasets, DNA motif analysis and interactive visualization虐译,基本上就是bulk ATAC能做的分析Signac都可以做瘪板。
簡要流程
文章中示例數(shù)據(jù)是來自10x的PBMC樣本,和轉(zhuǎn)錄組流程一樣漆诽,scATAC數(shù)據(jù)處理的第一步也是需要質(zhì)控:主要根據(jù)DNA accessibility assay和TSS enrichment score侮攀;接下來就是使用Seurat包進(jìn)行標(biāo)準(zhǔn)化處理和SCT轉(zhuǎn)換,分細(xì)胞亞群厢拭;到這里流程就遇到了一個(gè)瓶頸問題兰英,和scRNAseq類似,scATAC測序深度也不足供鸠,這樣對(duì)基因的檢測能力不強(qiáng)畦贸。因此,對(duì)scATAC數(shù)據(jù)的細(xì)胞亞群注釋多依賴于和scRNAseq結(jié)合來鑒定楞捂,而且一般都是scRNA和scATAC同時(shí)進(jìn)行才更有意義薄坏。
但是值得一提的是10x官方在今年年初就已經(jīng)推測了多種組合的單細(xì)胞多模態(tài)試劑盒,理論上我們已經(jīng)可以同時(shí)測一個(gè)細(xì)胞的轉(zhuǎn)錄組和ATAC了寨闹;此外胶坠,還可以對(duì)同一細(xì)胞表面蛋白進(jìn)行定量,如果聯(lián)合膜蛋白的信息和ATAC將會(huì)更準(zhǔn)確的對(duì)細(xì)胞亞群進(jìn)行定義繁堡。
Signac可以和MACS2做到無縫銜接沈善,后者是如今peak calling最常用的軟件乡数。進(jìn)一步對(duì)找出的peak進(jìn)行差異分析可以找到在細(xì)胞亞群見哪些基因的開發(fā)程度存在差異,聯(lián)合轉(zhuǎn)錄組的信息將會(huì)更準(zhǔn)確的找到具有潛在重要調(diào)節(jié)功能的基因闻牡,如MS4A1在B細(xì)胞群中的開放程度較高瞳脓;
對(duì)細(xì)胞因子,還可以進(jìn)行footprinting分析澈侠。轉(zhuǎn)錄因子結(jié)合到開放染色質(zhì)導(dǎo)致 Tn5 無法剪切該區(qū)域劫侧,會(huì)在覆蓋度高的開放區(qū)域(Peak)中出現(xiàn)小范圍的覆蓋度下降,因此這個(gè)下降的小區(qū)域稱為 TF footprint哨啃;通過這種分析我們可以得知在某些細(xì)胞亞群中發(fā)揮功能的細(xì)胞因子烧栋。
Signac主要的功能就介紹到這,具體的流程介紹可以去官網(wǎng)(https://satijalab.org/signac/articles/overview.html)查看拳球,下面給出Signac包的安裝代碼审姓,小伙伴們趕緊操練起來吧!
Signac requires that Bioconductor is installed:
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install()setRepositories(ind=1:2)
To install the latest release of Signac from CRAN:
install.packages("Signac")
To release the latest develop version from GitHub
if (!requireNamespace("remotes", quietly = TRUE))
install.packages("remotes")remotes::install_github("timoast/signac", ref = "develop")
拋出疑問
本來小編是想著先解讀這篇文章寫一個(gè)功能介紹的推文祝峻,后面再出一系列實(shí)操教程魔吐,但是現(xiàn)實(shí)是殘酷的,小編在跑Signac流程中遇到了很多問題莱找。與scRNAseq數(shù)據(jù)處理不同酬姆,scATAC對(duì)基因組注釋的版本要求很高,很容易出現(xiàn)各種基因組注釋問題奥溺,歡迎有相關(guān)經(jīng)驗(yàn)或者有scATAC數(shù)據(jù)分析的小伙伴通過私信聯(lián)系小編哦辞色。