日常掰蝦
??前面分別學習了DNA甲基化的基礎知識和甲基化BS-seq的分析方法,不知道的同學可以戳這里苹享,DNA甲基化知識概述弧可、DNA甲基化 Bismark & BAMAP 流程跑起來绷跑。
??今天接著來說DNA甲基化相關的內(nèi)容筷厘!BS-seq做為DNA甲基化的“金標準”還是有一定缺陷的驼修,所以科學家們一直在尋找更加無損的測序方法。目前已經(jīng)嶄露光芒的方向是將甲基化的C堿基轉換為T堿基的技術命咐。
??到底這種技術好不好呢篡九?
??帶著這個疑問,我們一起繼續(xù)往下看醋奠。
??今天的主要內(nèi)容關于(TET-assisted pyridine borane sequencing)榛臼,該技術的核心為Bisulfite-free,同時利用將甲基化的C堿基轉換為T堿基的方法窜司。
5caC/5fC 偶遇 Pyridine borane
??目前已有實驗證明TET蛋白可以將5-甲基胞嘧啶(5mC)and 5-羥甲基胞嘧啶(5hmC)氧化最終轉換為 5-羧基胞嘧啶(5caC)沛善,在此基礎上,作者通過MALDI技術發(fā)現(xiàn)5caC可以被吡啶硼烷及衍生物(Pyridine borane)還原為二氫尿嘧啶(dihydrouracil塞祈,DHU)金刁,而DHU在鏈擴增方面與自然的U堿基并沒有差異,這樣經(jīng)過PCR擴增DHU可以轉化為T,從而到達不用亞硫酸鹽處理將甲基化的C堿基轉為T堿基的目的尤蛮。其實漠秋,不僅5caC可以被吡啶硼烷還原,5-甲醯钟欤基胞嘧啶(5fC)也可以被還原為DHU庆锦,且兩種的還原效率都很高。另外轧葛,5caC 和 5fC 與吡啶硼烷還原反應可以分別被1-ethyl-3-(3-dimethylaminopropyl) carbodiimide搂抒、hydroxylamine conjugation這兩化合物所阻斷,這大大增加了TAPS技術的靈活性尿扯,如果結合市場上其他的甲基化測序技術求晶,理論上可以分別測定上面提到的幾種甲基化情況。
??做為Bisulfite-free的技術衷笋,TAPS的優(yōu)勢主要體現(xiàn)在以下幾個方面:1芳杏、實驗時間更短;2辟宗、實驗條件更溫和爵赵,室溫條件即可,而且對DNA片段的影響很小泊脐,基本不會引起DNA的降解空幻,可以保留更長的DNA片段,最長可達10kb容客。這樣構建出來的文庫具有更多的unique read秕铛,即文庫具有更高的復雜度;3缩挑、具有更好的測序質量但两,由于TAPS是將甲基化的C堿基轉換為T堿基,而甲基化的C在基因組中占比很小供置,轉劃后對文庫的堿基平衡幾乎沒有影響谨湘。從而提高堿基測序的質量。
TAPS VS WGBS
??從上面的結果可以看出TAPS技術的優(yōu)勢很明顯士袄,但只有這些優(yōu)勢可不行悲关,結果要穩(wěn)定才可以被接受。所以作者用TAPS的結果與“金標準”BS-seq做了一個對比娄柳,結果也顯示兩者甲基化結果的overlap很高。
分析
??前面介紹了技術艘绍,下面來看看如何分析TAPS的數(shù)據(jù)赤拒。作者基因用python打包了數(shù)據(jù)分析的軟件,用起來還是很方便的:
#安裝
pip install astair
#align
mkdir -p align
astair align -f genome.fa -1 sample_R1.fq.gz -2 sample_R2.fq.gz -d align
#Call methylation
mkdir methcall
astair call -i align/sample_mCtoT.cram -f genome.fa --context all -d methcall
輸出目錄結構如下:
taps
├── align
│ ├── taps_mCtoT.bam
│ └── taps_mCtoT.bam.bai
└── call
├── taps_mCtoT_all.mods
└── taps_mCtoT_all.stats
*_mCtoT_all.mods:甲基化文件,內(nèi)容如下:
#CHROM START END MOD_LEVEL MOD UNMOD REF ALT SPECIFIC_CONTEXT CONTEXT SNV TOTAL_DEPTH
chr1 3000002 3000003 0.0 0 1 C T CTG CHG No 2
chr1 3000004 3000005 0.0 0 2 G A CAG CHG No 3
chr1 3000008 3000009 0.0 0 2 C T CTA CHH No 4
chr1 3000015 3000016 0.0 0 3 G A CAA CHH No 5
chr1 3000017 3000018 0.0 0 3 G A CAC CHH No 5
chr1 3000018 3000019 * 0 0 G A CCA CHH homozygous 5
chr1 3000022 3000023 * 0 0 C A CTT CHH homozygous 4
chr1 3000026 3000027 0.0 0 3 G A CAA CHH No 7
chr1 3000028 3000029 0.0 0 3 G A CTC CHH No 7
chr1 3000029 3000030 0.0 0 3 G A CCT CHH No 7
*_mCtoT_all.stats是所有甲基化的統(tǒng)計信息挎挖。
??雖然軟件用起來很方便这敬,但是畢竟只是用python打包了一下,真正需要調用環(huán)境中軟件蕉朵。比如align這步崔涂,會用環(huán)境中的bwa、samtools始衅。所以安裝好astair
并不能直接使用冷蚂,使用時還要保證調用的軟件在環(huán)境變量里面。
碎碎念
??從文章結果來看汛闸,TAPS的結果與BS-seq有很好的一致性蝙茶,而且其優(yōu)勢也很明顯,總體來說TAPS的潛力還是很大的诸老,具體能不能成為主流隆夯,我們靜觀其變。按照慣例下面會給出參考資料别伏,方便有需要的朋友蹄衷。今天的分享到此結束~~~
Liu Y , P Siejka-Zielińska, Velikova G , et al. Bisulfite-free direct detection of 5-methylcytosine and 5-hydroxymethylcytosine at base resolution[J]. Nature Biotechnology, 2019.
軟件:https://bitbucket.org/bsblabludwig/astair