作者 | Arno
審稿 | 童蒙
編輯 | amethyst
ATAC-seq技術(shù)由于其要求細胞量少辜昵,實驗簡單、快速拜马、高效且應(yīng)用范圍廣考抄,是近年來轉(zhuǎn)錄調(diào)控细疚、表觀遺傳修飾研究的一項重要的技術(shù)手段。近兩年應(yīng)用ATAC-seq方法發(fā)表的文章數(shù)量也是飛速上升川梅,可見ATAC-seq的火爆程度》杓妫現(xiàn)在然遏,如果你還不了解ATAC,還不抓緊學(xué)起來吧彪!今天我們先來學(xué)習(xí)一下ATAC-seq相關(guān)的背景介紹待侵。
背景介紹
01.染色質(zhì)可及性介紹
在介紹ATAC-seq之前,不得不提的就是染色質(zhì)可及性的概念姨裸。大家知道秧倾,真核生物的DNA會與組蛋白結(jié)合形成核小體,核小體進一步壓縮折疊形成具有高級結(jié)構(gòu)的染色體啦扬,染色體的高級結(jié)構(gòu)在細胞周期的不同的時期壓縮折疊程度不同,間期比較松散凫碌,此時的狀態(tài)被稱為染色質(zhì)扑毡,用于和中期高度壓縮的染色體進行區(qū)分。
研究者發(fā)現(xiàn)DNA內(nèi)切酶可以對染色質(zhì)進行切割盛险,這些切割位點稱為DNA超敏感位點瞄摊。DNA超敏感位點位于沒有組蛋白包裹的DNA片段上,這些位點的分布往往具有一定的規(guī)律性——切割后的DNA片段都在100-200bp左右苦掘。這些可以被切割下來的裸露的100-200bp的DNA片段稱為開放染色質(zhì)换帜。后期進一步的研究發(fā)現(xiàn),開放染色質(zhì)通常是轉(zhuǎn)錄因子鹤啡、增強子惯驼、絕緣子或者其他調(diào)控蛋白結(jié)合的片段,結(jié)合的過程仿佛是觸發(fā)了細胞內(nèi)的開關(guān)递瑰,可以影響細胞內(nèi)基因復(fù)制以及調(diào)控基因的轉(zhuǎn)錄活性祟牲。DNA的這種被結(jié)合的特性稱為染色質(zhì)的可及性(chromatin accessibility)。
染色質(zhì)的可及性是近些年的研究熱點抖部。由于染色質(zhì)的開放程度是動態(tài)變化的说贝,這種變化是影響基因表達調(diào)控的關(guān)鍵決定因素,在細胞分化慎颗、發(fā)育以及各類疾病的發(fā)生發(fā)展研究中具有重要的作用乡恕。
02.染色質(zhì)可及性技術(shù)
目前研究染色質(zhì)可及性的方法總結(jié)主要有以下幾種技術(shù):MNase-seq、DNase-seq俯萎、FAIRE-seq傲宜、NOMe-seq以及ChIP-seq和ATAC-seq技術(shù)。
MNase-seq[1]是使用內(nèi)切核糖酶--微球菌核酸酶(micrococcal nuclease, MNase)處理染色質(zhì)夫啊,由于MNase同時具備核酸外切酶和內(nèi)切酶活性蛋哭,所以在對DNA進行消化時,會將裸露的DNA全部切割掉涮母,直到遇到核小體或DNA結(jié)合蛋白等阻遏物保護谆趾,因此MNase-seq技術(shù)是將含有核小體包裹的區(qū)域切割下來進行測序躁愿,然后通過反向比較獲得開放染色質(zhì)區(qū)域。
DNase-seq[2]與MNase-seq技術(shù)互補沪蓬,利用脫氧核糖核酸酶(DNaseI)識別DNaseI敏感位點彤钟,將裸露的DNA片段切割下來進行測序。
FAIRE-seq[3]技術(shù)是利用甲醛將染色質(zhì)中裸露的DNA進行固定跷叉,隨后進行超聲波打斷逸雹,再利用傳統(tǒng)的DNA提取方法——酚氯仿抽提,來分離打斷的DNA云挟,從而進行高通量測序梆砸。
NOMe-seq[4]技術(shù)是通過人工甲基化修飾的方法進行核小體定位。使用GpC甲基轉(zhuǎn)移酶處理固定的染色質(zhì)园欣,使未被核小體以及其他結(jié)合蛋白保護的GpC二核苷發(fā)生甲基化帖世,由于基因組中含有大量的GpC,通過酶的處理可對核小體足跡進行高分辨的定位沸枯。
ChIP-seq[5]技術(shù)是通過染色質(zhì)免疫共沉淀及時特異性地富集目的蛋白結(jié)合的DNA片段進行高通量測序日矫,常用于特定轉(zhuǎn)錄因子或組蛋白特異性修飾位點的研究。
-
ATAC-seq[6]技術(shù)通過轉(zhuǎn)座酶Tn5容易結(jié)合在開放染色質(zhì)(未經(jīng)蛋白或核小體保護的DNA部位)的特性绑榴,在整個基因組范圍內(nèi)對Tn5酶捕獲到的DNA片段進行高通量測序哪轿。
ATAC-seq技術(shù)介紹
1.技術(shù)原理
ATAC-seq(Assay for Transposase-Accessible Chromatin with highthroughput sequencing),利用超活性的Tn5轉(zhuǎn)座酶容易結(jié)合在開放染色質(zhì)的特性翔怎,通過Tn5酶切割基因組窃诉,在對切割下來的序列形成的轉(zhuǎn)座酶復(fù)合物上,連接測序的barcode赤套,構(gòu)建成測序文庫褐奴,并對測序文庫進行測序,獲得結(jié)合區(qū)域相關(guān)信息于毙。
2.優(yōu)勢
- 建庫簡單快捷敦冬,耗時短,重復(fù)性好
- 需要的細胞數(shù)目較少(一般500-50000個)
- 全基因組范圍內(nèi)檢測
- 同時檢測開放的DNA區(qū)域和被核小體占據(jù)的區(qū)域
3.ATAC-seq實驗的幾個建議
良好的實驗設(shè)計以及操作是ATAC-seq成功的關(guān)鍵唯沮,關(guān)于實驗策略有如下建議[8]:
- 生物學(xué)重復(fù):最好有兩個生物學(xué)重復(fù)脖旱,而且2個重復(fù)足夠了
- 對照:最好使用對照,可以用不使用轉(zhuǎn)座酶Tn5處理的樣本做對照
- PCR擴增:擴增次數(shù)盡量少介蛉,以減少PCR引入dup
- 數(shù)據(jù)量:測序數(shù)據(jù)量一般跟基因組大小有關(guān)萌庆,對于人類樣本,推薦50M/樣本币旧。一般來說測序數(shù)據(jù)越多践险,比對結(jié)果會越準(zhǔn)確,尤其對于復(fù)雜基因組,如:高重復(fù)基因組巍虫,可以提升比對準(zhǔn)確性
- 測序策略:推薦使用paired-end彭则,原因有以下幾個方面:a.能夠更準(zhǔn)確的鑒定轉(zhuǎn)座酶的插入位置,確定插入片段長度占遥。單端測序雖然可以通過計算模型去推斷片段長度俯抖,但是沒有那么準(zhǔn)確。b.雙端測序?qū)τ诒葘浖咛ィ菀赘鼫?zhǔn)確的鑒定dup的reads芬萍,提高分析結(jié)果的準(zhǔn)確性。
分析步驟
1.原始下機數(shù)據(jù)的過濾質(zhì)控
背景中介紹到搔啊,用來結(jié)合轉(zhuǎn)錄因子的染色質(zhì)開放區(qū)域一般為100-200bp的小片段柬祠。隨著測序技術(shù)的發(fā)展,我們ATAC-seq進行的高通量測序的策略一般是PE150(之前大部分為SE50)负芋,因此雙端測序能測的插入片段大約在350bp左右漫蛔。在這種情況下,我們實際測出的reads會把Tn5酶捕獲到的片段測通示罗,為了最大程度的利用測序數(shù)據(jù)惩猫,我們在數(shù)據(jù)清洗過程中一般會用Trim的形式進行過濾芝硬,即將reads中判斷為接頭的部分截取掉蚜点。
- 過濾的主要目的:1.去除接頭污染;2.去除低質(zhì)量reads
- 使用Trimmomatic軟件進行過濾
java -Xms1G -Xmx10G -XX:ParallelGCThreads=4 -jar trimmomatic-0.36.jar PE -threads 4 -phred33 \ ##指定內(nèi)存拌阴、線程以及測序類型
raw_R1.fq.gz raw_R2.fq.gz \
clean_R1.fq.gz clean_unpaired_R1.fq.gz clean_R2.fq.gz clean_unpaired_R2.fq.gz \
ILLUMINACLIP:trim_adapter.fa:2:30:10 \ ##切除含接頭污染的序列绍绘,允許的最大mismatch為2,palindrome模式下匹配堿基數(shù)為30迟赃,simple模式下的匹配堿基數(shù)為10陪拘;
LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36 \ ## 切除Reads兩端堿基,參數(shù):LEADING:3 TRAILING:3纤壁,截掉Reads首端和末端質(zhì)量值小于3或為N的堿基左刽;舍棄Trim后長度小于36nt的Reads ##采用滑窗法切除Reads中低質(zhì)量的堿基,參數(shù):SLIDINGWINDOW:4:15酌媒,4bp窗口內(nèi)堿基質(zhì)量均值小于15則切除欠痴;
2> trim_report.txt
過濾完成,得到clean數(shù)據(jù)后秒咨,就可以進行數(shù)據(jù)的比對喇辽、質(zhì)控,以及各種可視化展示和peak calling分析了雨席。后續(xù)分析內(nèi)容菩咨,我們下期繼續(xù)進行分享,感興趣的小伙伴,趕快關(guān)注我們吧~
參考文獻:
- Mieczkowski, J. et al. MNase titration reveals differences between nucleosome occupancy and chromatin accessibility. Nat. Commun. 7, 1 1485 (2016).
- Crawford, G. E. et al. DNase-chip: a high- resolution method to identify DNase I hypersensitive sites using tiled microarrays. Nat. Methods 3, 503–509 (2006).
- Song L , Zhang Z , Grasfeder L L , et al. Open chromatin defined by DNaseI and FAIRE identifies regulatory elements that shape cell-type identity[J]. Genome Research, 2011, 21(10):1757-1767.
- Krebs, A. R. et al. Genome- wide single- molecule footprinting reveals high RNA polymerase II turnover at paused promoters. Mol. Cell 67, 41 1–422
- Schmidt D , Wilson M D , Spyrou C , et al. ChIP-seq: Using high-throughput sequencing to discover protein–DNA interactions[J]. Methods, 2009, 48(3):0-248.
- Buenrostro, J. D., Giresi, P . G., Zaba, L. C., Chang, H. Y . & Greenleaf, W. J. T ransposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA- binding proteins and nucleosome position. Nat. Methods 10, 1213–1218 (2013).
- Klemm S L, Shipony Z, Greenleaf W J. Chromatin accessibility and the regulatory epigenome[J]. Nature Reviews Genetics, 2019: 1.
- https://informatics.fas.harvard.edu/atac-seq-guidelines.html(2017).
“春天”腳步已近! 一起進步~