? ? ? ? 以小編自己最近在做的HBV mapping為例罚缕,前期的環(huán)境部署及軟件安裝找時間再細(xì)說,直接進(jìn)入主題怎静,如下:
前期準(zhǔn)備:
Linux以及Windows操作系統(tǒng)邮弹,HISAT2、Samtools以及IGV等軟件的安裝蚓聘,fastq文件
操作步驟:
1. 在NCBI中找到HBV genotypeD的序列并下載sequence.gb以及sequence.fa格式文件腌乡。
2. 使用HISAT2構(gòu)建HBV genome的Index,命名為HBVgenotypeD夜牡。
extract_exons.py sequence.gb > exons.txt
extract_splice_sites.py sequence.gb > splicesites.txt
hisat2-build --s splicesites.txt --exon exons.txt PATH/sequence.fa HBVgenotypeD
3. 采用HISAT2進(jìn)行mapping獲得sam文件与纽,命名為HBVmaping.sam。
hisat2 -p 8 --dta -x PATH/ HBVgenotypeD -1 HBV_R1.fastq.gz -2 HBV_R2.fastq.gz -S HBVmaping.sam
5. 采用Samtools將sam文件sort為bam文件,命名為HBVmaping.bam急迂。
samtools sort -@ 8 -o HBVmaping.bam HBVmaping.sam
6. 對bam文件建立index影所。
samtools index HBVmaping.bam
7. 打開IGV,genome——load genome from file僚碎,選擇sequence.fa猴娩;File——load from file,選擇HBVmaping.bam听盖。結(jié)果如下:
大功告成胀溺!
怎么樣,是不是很簡單呢皆看?快來試一試吧仓坞!