Bisulfitesequencing,實(shí)驗(yàn) BS 處理 C->U(T) 轉(zhuǎn)化效率并不是 100% 的,轉(zhuǎn)化失敗的部分 C 會成為假陽性信號波附,所以 BS 轉(zhuǎn)化率也是很重要的指標(biāo)。計(jì)算轉(zhuǎn)化率需要建庫實(shí)驗(yàn)摻入已知不含甲基化的 DNA(由于線粒體 DNA 可以認(rèn)為是無甲基化修飾的 DNA,也可使用線粒體 DNA 來評估)溜哮,理論上所有該 DNA 的C 都會被轉(zhuǎn)化為 U(T),通過比對和甲基化計(jì)算分析色解,會得到該 DNA 的甲基化率為 0. 實(shí)際肯定不為 0茂嗓,這部分甲基化就是轉(zhuǎn)化失敗的,所以 1 減去甲基化率就是轉(zhuǎn)化率科阎。BS 轉(zhuǎn)化率述吸,我們一般要求要在 99%以上。摻入已知不含甲基化的 DNA 一般常用是 Enterobacteria phage lambda (lambda DNA)锣笨。參考基因組序列 NC_001416.1 可以在 NCBI 下載:https://www.ncbi.nlm.nih.gov/nuccore/NC_001416.1如果使用樣本本身的線粒體 DNA 來評估蝌矛,建議使用線粒體 DNA 上非 CG 位點(diǎn)/或者 CC 位點(diǎn)的甲基化水平來評估。
1.比對
bsmap -a 1.fq -b 2.fq -d lambda.fa/chrMt.fa -o BSconvert.sam -p 8 -z 33 -r 1 -m 50 -x 1000
2.sam2bam
samtools view -Sb BSconvert.sam > BSconvert.bam
3.提取甲基化位點(diǎn)
python methratio.py -d lambda.fa/chrMt.fa -m 1 -o BSconvert.met.txt BSconvert.bam
4.統(tǒng)計(jì)甲基化轉(zhuǎn)化率
perl -alne 'next if $.==1; next if $F[3] eq "CG"; $m+=$F[6]; $n+=$F[7]; END{ print "“BS_convert_ratio\t".sprintf("%.5f", $n/($m+$n));}' BSconvert.met.txt