序自《2020-02-08 wget(含參數(shù)技巧)下載eggNOG數(shù)據(jù)庫、安裝以及碰到的問題》
一啄育、使用
1、數(shù)據(jù)庫內(nèi)容
在下載好eggnog數(shù)據(jù)庫之后,
1)og2level.tsv.gz羊娃;;2)eggnog.db.gz埃跷;蕊玷;3)OG_fasta.tar.gz;弥雹;4)eggnog_proteins.dmnd.gz垃帅;;
5)HMM database(s): bact(存在了HMM_dblevels里)
包括:index.html剪勿;贸诚;bact_50.hmm.h3f;;bact_50.hmm.h3i酱固;械念;bact_50.hmm.h3m;运悲;bact_50.hmm.h3p龄减;;bact_50.hmm.idmap扇苞;欺殿;bact_50.info;鳖敷;bact_50.pkl
2脖苏、安裝好后測試
在軟件安裝目錄下
emapper.py -h? ? ? ? #查看使用幫助
python emapper.py -i test/polb.fa --output polb_bact -d bact --data_dir ~/data/eggnog.db? ? ? ? #按照別人的操作,我的報(bào)的報(bào)錯(cuò)了定踱,后來發(fā)現(xiàn)是不能到eggnog,db下棍潘,因?yàn)樗皇且粋€(gè)目錄,這是一個(gè)文件(也看是跟我下載的我有關(guān)系)python emapper.py -i test/polb.fa --output polb_bact -d bact --data_dir ~/data? ? ? ? #這樣就可以了
出現(xiàn)這些就證明可以正常使用了崖媚!
二亦歉、使用
注意:
python emapper.py -i /share/data1//lx_genome/genepredict/SZDP190917115/115.pep --resume --output 115_bact -d bact --data_dir /share/data1//software/eggnog-mapper-1.0.3/data
參數(shù)的選擇以及解釋:
參考:http://www.reibang.com/p/e646c0fa6443
eggnog-mapper默認(rèn)是以HMMER進(jìn)行序列搜索,盡管這可以通過-m diamond更改成DIAMOND畅哑,但結(jié)果中就會缺少一些信息列肴楷。
-d/--database表示搜索數(shù)據(jù)庫的類型,既可以是"euk, bact, arch" 三大類的其中一種荠呐,也可以是"eggnog-mapper/data/OG_fasta"中的小類赛蔫,例如"maNOG"表示的就是哺乳動物的NOG。此外也可以是自定義HMM數(shù)據(jù)庫泥张,-d /path/to/pfam.hmm
--usemem和--cpu?線程數(shù)提高運(yùn)行速度(如果服務(wù)器內(nèi)存比較大呵恢,線程比較多的話)
--output表示輸出文件的前綴,默認(rèn)輸出在當(dāng)前文件夾下媚创,
--output_dir可以更改為其他文件路徑渗钉;
--resume表示任務(wù)重啟后可以跳過之前已經(jīng)完成的部分,?
--override則表示覆蓋原先的輸出結(jié)果钞钙。
其他幾個(gè)基因的分析命令同上
至于如何同時(shí)使用這個(gè)在后臺同時(shí)運(yùn)行多條鳄橘,還需要學(xué)習(xí),以后會補(bǔ)上芒炼。
三瘫怜、結(jié)果
注意:生成的文件默認(rèn)存在當(dāng)前的目錄下
參數(shù)參考:
1、使用eggNOG數(shù)據(jù)庫進(jìn)行基因功能注釋?http://www.chenlianfu.com/?p=2804
2焕议、序列功能注釋神器:eggNOG-mapper,KEGG/COG/KOG/GO/BiGG 一網(wǎng)打盡http://www.biostack.org/?p=698