利用snpEff軟件可以對獲得的snp信息進行注釋,以確定該snp對于基因編碼信息的影響:同義替換、非同義替換婚陪、非編碼區(qū)等等
首先查看snpeff.config 文件中有無自己需要的基因組稿饰,若沒有則需要自己構建,以B73_v5為例構建本地數(shù)據(jù)庫旦万。
snpEff 安裝
#若無法調(diào)用Java,則需要進行Java安裝
sudo apt install default-jre
#下載SnfEff軟件
wget https://datasetsnpeff.blob.core.windows.net/dataset/versions/snpEff_latest_core.zip?sv=2019-10-10&st=2020-09-01T00%3A00%3A00Z&se=2050-09-01T00%3A00%3A00Z&si=prod&sr=c&sig=isafOa9tGnYBAvsXFUMDGMTbsG2z%2FShaihzp7JE5dHw%3D
unzip snpEff_latest_core.zip
cd snpEff_latest_core
B73基因組基因組等文件下載
wget https://download.maizegdb.org/Zm-B73-REFERENCE-NAM-5.0/Zm-B73-REFERENCE-NAM-5.0_Zm00001eb.1.gff3.gz
wget https://download.maizegdb.org/Zm-B73-REFERENCE-NAM-5.0/Zm-B73-REFERENCE-NAM-5.0.fa.gz
wget https://download.maizegdb.org/Zm-B73-REFERENCE-NAM-5.0/Zm-B73-REFERENCE-NAM-5.0_Zm00001eb.1.protein.fa.gz
gunzip -d *.gz
配置snpEff 數(shù)據(jù)庫
mkdir data ./data/genomes ./data/B73_v5
# 將基因組文件放入genomes文件夾镶蹋,并更改為B73_v5.fa
mv ./Zm-B73-REFERENCE-NAM-5.0.fa ./data/genomes/B73_v5.fa
# 將蛋白序列及gff文件放入B73_v5文件夾成艘,并改名
mv ./Zm-B73-REFERENCE-NAM-5.0_Zm00001eb.1.gff3 ./data/B73_v5/genes.gff
mv ./Zm-B73-REFERENCE-NAM-5.0_Zm00001eb.1.protein.fa ./data/B73_v5/protein.fa
# 更改snpEff.config 的配置信息
vim ./smpEff.config
#加入如下信息
#maize genome,version B73_v5
B73_v5.genome:maize
#運行以下命令
java -jar snpEff.jar build -gff3 -v B73_v5
對snp進行注釋
將所要注射的snp vcf文件拷入snp文件夾,運行以下命令贺归,獲得注釋結果
java -jar ./snpEff.jar B73_v5 ./snp.vcf > Result.out
個人學習筆記淆两。