autoprokka.py這個Python腳本可以方便地批量地使用prokka去進行注釋,自動按照輸入文件名去命名輸出文件,并且每個樣本單獨一個文件夾存放注釋后結(jié)果桑李,.gff文件會統(tǒng)一復(fù)制一份到輸出文件夾里,方便后續(xù)分析使用,如roary泛基因組分析蜒犯。
腳本可以直接到github腳本源下載解壓组橄,也可以使用git下載:
git clone https://github.com/stevenjdunn/autoprokka.git
下載完成后進入:
cd autoprokka/
下載完成后,需要根據(jù)需要添加prokka的參數(shù)罚随,用notepad++打開autoprokka.py玉工,在第82行內(nèi)加入
原代碼:
subprocess.call(['prokka', fastain, '-o', fastaout, '--prefix', pre])
按需要和其格式輸入需要的參數(shù),如我自己用的:
subprocess.call(['prokka', fastain, '-o', fastaout, '--prefix', pre, '--addgenes', '--locustag', pre, '--genus', 'Escherichia', '--species', 'coli', '--strain', pre, '--kingdom', 'Bacteria', '--gcode', '11', '--cpus', '72'])
添加完成后淘菩,保存文件遵班,即可以使用。
使用方法:
python autoprokka.py -i 輸入文件夾/ -o 輸出文件夾/
即可潮改,若要提取.gbk文件狭郑,則
python autoprokka.py -i 輸入文件夾/ -o 輸出文件夾/ -gbk
參考
1.autoprokka 源地址:https://github.com/stevenjdunn/autoprokka
2.Seemann T. Prokka: rapid prokaryotic genome annotation
Bioinformatics 2014 Jul 15;30(14):2068-9. PMID:24642063