1、將參考基因組進(jìn)行重亞硫酸鹽的預(yù)處理轉(zhuǎn)換
bismark_genome_preparation --verbose --bowtie2 ~/WGBS/ref/
結(jié)果:
2待榔、將數(shù)據(jù)比對(duì)到已經(jīng)轉(zhuǎn)化了的參考基因組上
一次處理單個(gè)樣本:
bismark -p 8 --genome ~/WGBS/ref -1 ~/WGBS/2_CleanData/control/control_P_R1.clean.fq -2 ~/WGBS/2_CleanData/control/control_P_R2.clean.fq -o ~/WGBS/map
一次處理多個(gè)樣本:
bismark -p 8 --genome ~/WGBS/ref -1 ~/WGBS/2_CleanData/control/control_P_R1.clean.fq -2 ~/WGBS/2_CleanData/control/control_P_R2.clean.fq -o ~/WGBS/map;bismark -p 8 --genome ~/WGBS/ref -1 ~/WGBS/2_CleanData/insulin/insulin_P_R1.clean.fq -2 ~/WGBS/2_CleanData/insulin/insulin_P_R2.clean.fq -o ~/WGBS/map;bismark -p 8 --genome ~/WGBS/ref -1 ~/WGBS/2_CleanData/Insulin_hcg/Insulin_hcg_P_R1.clean.fq -2 ~/WGBS/2_CleanData/Insulin_hcg/Insulin_hcg_P_R2.clean.fq -o ~/WGBS/map
ps:--genome /路徑/ref ref目錄下要有Bisulfite_Genome目錄和GRCm38.p6.genome.fa文件慎宾;-p 8 線程數(shù)赦抖,將整個(gè)任務(wù)分成若干小塊同時(shí)處理压鉴,可以提高運(yùn)行效率
用分號(hào)(惧所;)分割命令骤坐,可以一次處理完所有要比對(duì)的序列
結(jié)果:
3、將bismark比對(duì)生成的bam文件進(jìn)行排序和索引(排序和索引去重復(fù)后進(jìn)行)
排序(排序的目的是為了下游分析的方便)
for i in control_P_R1 Insulin_hcg_P_R1 insulin_P_R1;do samtools sort $i.clean_bismark_bt2_pe.bam -o $i.clean_bismark_bt2_pe.sorted.bam
對(duì)排序后的文件進(jìn)行索引(生成.bai文件)
for i in control_P_R1 Insulin_hcg_P_R1 insulin_P_R1;do samtools index $i.clean_bismark_bt2_pe.sorted.bam;done
結(jié)果:
一條命令完成排序和索引:
for i in control_P_R1 Insulin_hcg_P_R1 insulin_P_R1;do samtools sort $i.clean_bismark_bt2_pe.bam -o $i.clean_bismark_bt2_pe.sorted.GG.bam;samtools index $i.clean_bismark_bt2_pe.sorted.GG.bam;done