在基因組注釋中,預(yù)測基因結(jié)構(gòu)是最核心的一環(huán),在眾多的從頭預(yù)測軟件中第煮,augustus應(yīng)用較廣。但是由于安裝過程依賴軟件較多抑党,如果沒有管理員權(quán)限一般不要輕易嘗試包警,有興趣可以參考 基因預(yù)測軟件中的奧古斯都。
1. 腳本運行
$ augustus --strand=both --genemode=partial --singlestrand=false --hintsfile=hints.gff --extrinsicCfgFile=extrinsic.cfg --protein=on --introns=on --start=on --stop=on --cds=on --codingseq=on --alternatives-from-evidence=true --gff3=on --UTR=on ----outfile=out.gff --species=human genome.fa
$ augustus --noprediction=true --species=SPECIES sequences.gb
參數(shù)解釋:
--strand=both,--strand=forward or --strand=backward 表示注釋基因在兩條鏈還是其中一條底靠;
--genemodel=partial, --genemodel=intronless, --genemodel=complete,--genemodel=atleastone or --genemodel=exactlyone
partial :?允許在序列邊界預(yù)測不完整的基因(默認值) ? ?intronless :?只預(yù)測單外顯子基因害晦,如在原核生物和一些真核生物中? ? complete :?只預(yù)測完整基因 ? atleastone :?預(yù)測至少一個完整的基因 ? ?exactlyone :?準確預(yù)測一個完整的基因;
--singlestrand=true?獨立預(yù)測每條鏈上的基因暑中,允許在相反的鏈上有重疊的基因壹瘟。這個選項在默認情況下是關(guān)閉的;
--hintsfile=hintsfilename?當使用此選項時鳄逾,將打開考慮提示(外部信息)的預(yù)測稻轨。hintsfilename包含gff格式的提示;
--extrinsicCfgFile=cfgfilename?可選的雕凹。此文件包含用于提示及其boni和mali的使用源列表殴俱。如果沒有指定配置目錄中的extrinsic.cfg文件政冻,則使用$AUGUSTUS配置路徑;(不太懂)
--maxDNAPieceSize=n?此值指定是為了運行核心算法(Viterbi)而將序列分割成的片段的最大長度线欲。默認的是——maxDNAPieceSize = 200000明场;
--protein=on/off
--introns=on/off
--start=on/off
--stop=on/off
--cds=on/off
--codingseq=on/off
輸出選項。輸出預(yù)測蛋白序列李丰,內(nèi)含子苦锨,起始密碼子,終止密碼子趴泌≈凼妫或者在“初始”、“內(nèi)部”嗜憔、“終端”和“單外顯子”之外使用“cds”魏蔗。cds不包括停止密碼子(除非stopCodonExcludedFromCDS=false),而終端和單個外顯子包含停止密碼子;
--AUGUSTUS_CONFIG_PATH=path?配置config的路徑(如果沒有就指定為環(huán)境變量)痹筛;
--gff3=on/off 輸出gff3格式莺治;
--proteinprofile=filename 讀取蛋白序列;
--predictionStart=A, --predictionEnd=B 針對某一特定區(qū)域進行注釋帚稠,可以快速注釋某一感興趣的區(qū)域谣旁;
--UTR=on/off?預(yù)測除編碼序列外的未翻譯區(qū)域。目前滋早,這只適用于人類榄审,galdieria, toxopl asma和caenorhabditis;
--outfile=filename?打印輸出到文件名而不是標準輸出杆麸;
--noInFrameStop=true/false?不要返回帶有終止密碼子的轉(zhuǎn)錄本搁进。否則,可能會發(fā)生內(nèi)含子跨越終止密碼子昔头。默認值:假饼问;(不太懂)
--noprediction=true/false?Augustus也可以以genebank格式文件為輸入文件,進行基因預(yù)測揭斧,并將預(yù)測結(jié)果和genebank的結(jié)果進行比較后得出一個精確性的統(tǒng)計結(jié)果莱革。