這兩天在基因課上學(xué)了一下eggnog-mapper慌植,先看文章甚牲,然后看視頻課程,正好工作有需要對(duì)一批轉(zhuǎn)錄本進(jìn)行功能注釋蝶柿。搗鼓一下丈钙,在基因課的服務(wù)器上操作的,特此記錄一下交汤。
- 文章:Fast genome-wide functional annotation through orthology assignment by eggNOG-mapper
- 使用文檔
- hoptop筆記
- 劉小澤
基本信息兩位師兄都是珠玉在前雏赦,我就不說了。下面說一下我的使用感受芙扎。
我要功能注釋的蛋白序列文件大概有18M星岗,使用
grep ">" text.pep.fa | wc -l
# 33932
那么推薦應(yīng)該用diamond模式,命令如下:
nohup python2 /pub/software/eggnog-mapper-1.0.3/emapper.py -m diamond -i text.pep.fa -o Tea_annotation --usemem --cpu 6 &
報(bào)錯(cuò):Error: Database was built with a different version of diamond as is incompatible.戒洼,與鏈接里面發(fā)生的問題一樣俏橘。隨后我用他的解決辦法發(fā)現(xiàn)需要使用 /pub/software/eggnog-mapper-1.0.3/bin/diamond的 diamond命令,而這個(gè)是0.8.22的老版本我使用的conda安裝的0.9.21新版本圈浇。所以作者說只能使用這里面的老diamond寥掐。因此我就需要將老版本加入環(huán)境變量并覆蓋新版本靴寂。辦法是只要在環(huán)境變量加入的位置放在新的后面就可以覆蓋。果然就解決了召耘“倬妫花了可能三四個(gè)小時(shí)不到就完成了。前一天作死用hmmer模式跑結(jié)果十多個(gè)小時(shí)就跑出來20個(gè)結(jié)果怎茫。果然diamond真快收壕!
BTW:我想把實(shí)驗(yàn)室的服務(wù)器也裝上eggnog-mapper,困難的是服務(wù)器下載那些數(shù)據(jù)庫文件太慢了轨蛤,而那些文件加起來可能有70多G蜜宪。所以只能本地下載,再上傳到服務(wù)器上祥山,不知道最后能不能運(yùn)行成功圃验。只能走一步,看一步缝呕。
結(jié)果證明是完全可行的!