測序-比對-找變異
主題:輸入文件——輸出文件——知道使用軟件。
1.測序惧盹,實現(xiàn)下機數(shù)據(jù)的過濾阀参。Fastq數(shù)據(jù)肝集,用FASTP軟件(第一列:文件名;第二列:序列结笨;第三列:正負鏈包晰;第四列:測序的質(zhì)量);進行了數(shù)據(jù)指控Fastq數(shù)據(jù)
2.bwa 軟件的過濾作用:將序列比對到參考基因組炕吸。利用bwa軟件,實現(xiàn)的是勉痴,將fastq數(shù)據(jù)轉化成sam文件赫模。一般下機的數(shù)據(jù)多為sam 文件。
3.短序列比對蒸矛,利用samtools:將sam 文件轉化成bam文件瀑罗,因為bam 文件是二進制文件,更省空間雏掠,sam 文件占用內(nèi)存較大斩祭。使用samtools軟件進行轉換,同時乡话,還可以實現(xiàn)對bam文件的排序摧玫。
4.使用GATKcall軟件,進行變異的檢測绑青。實現(xiàn)將bam文件轉化成VCF文件诬像。
5.ANNOVA根據(jù)參考基因組進行自建庫屋群,對基因變異進行功能注釋。