MEGAN(Metagenome Analyzer)
是宏基因組學(xué)進(jìn)行物種和功能研究的常用軟件掏膏,實(shí)際上現(xiàn)在的Diamond+MEGAN6
已經(jīng)是一套比較完整的物種和功能注釋流程了原杂。
但是由于各種原因,我們在流程中使用的并非最新版名眉。不同版本的MEGAN
使用方法差別較大粟矿,尤其在命令行模式下。網(wǎng)上的關(guān)于這方面的資料也寥寥無幾损拢,這里簡單記錄下使用方法,主要是針對Linux
平臺(tái)的使用撒犀。
MEGAN
的GUI
版相對友好福压,如果你在Windows
平臺(tái)使用過該軟件,那么在Linux
上使用和理解起來相對容易些或舞。
MEGAN 4
歷史悠久荆姆,基本上已經(jīng)淘汰了。命令行直接配置參數(shù)即可映凳,貌似也不要license
胆筒。
示例如下:
xvfb-run.sh --auto-servernum --server-num=1 \\
MEGAN +g -x \\
"import blastfile=all.blastout_m8.add_taxoid meganfile=all.rma ;\\
recompute toppercent=5;\\
recompute minsupport=1;\\
update;\\
collapse rank=Species;\\
update;\\
select nodes=all;\\
export what=CSV format=readname_taxonid separator=tab file=all.result;\\
update;\\
close"
Megan
的參數(shù)非常之多,以上僅列出了一些最主要的參數(shù)诈豌,+g
表示開啟非圖形模式(即命令行模式)仆救,-x
后接引號(hào)內(nèi)的MEGAN
參數(shù),更多可參考MEGAN4 Manual矫渔。除了導(dǎo)入彤蔽、導(dǎo)出之外,其中toppercent
表示取比對數(shù)目的前百分之多少庙洼,minsupport
表示至少取一條顿痪,collapse
表層級(jí)折疊镊辕,select nodes
表示選擇方式。命令行中參數(shù)是一行一行處理的蚁袭,所以要加入updates
來鏈接命令征懈。
MEGAN 5
主頁download。需要用教育網(wǎng)郵箱注冊獲取license
揩悄,將License certificate
內(nèi)容新建一個(gè)名為MEGAN5-academic-license.txt
的文件保存卖哎。命令行使用時(shí)通過-L
參數(shù)來指定它。
另外虏束,MEGAN5
需要新建一個(gè)參數(shù)配置文件棉饶,類似MEGAN4
中的引號(hào)內(nèi)容,以便MEGAN
解析镇匀。為避免不同版本的差異照藻,更多參數(shù)最好查看MEGAN5 Manual。
例如汗侵,制作參數(shù)文件command.txt
如下:
load taxRefSeqFile='./MEGAN/database/prot_acc2tax-Jul2019X1.abin';
import blastFile=Redtide.blastnr.all fastaFile=Redtide.fa meganFile=tab.rma blastFormat=BlastTAB;
recompute toppercent=5;
recompute minsupport=1;
update;
collapse rank=Species;
update;
select nodes=all;
export what=CSV format=readname_taxonid separator=tab file=tab.result;
update;
quit;
網(wǎng)上有些很舊的資料幸缕,如http://seqanswers.com/forums/showthread.php?t=43535加載的是load taxGIFile=gi_taxid_prot.bin
文件,但是GI
號(hào)NCBI
已經(jīng)不再維護(hù)了晰韵,所以目前這個(gè)文件想下都下不到发乔。包括blast
比對的結(jié)果也不再顯示GI
號(hào),僅顯示accessionID
雪猪。關(guān)于ID
的解釋栏尚,生信技能樹有一篇總結(jié)比較全面,不了解的可以參考下只恨。比較一下NCBI
的blast
結(jié)果以前的和現(xiàn)在的區(qū)別:
現(xiàn)在MEGAN
官網(wǎng)能下的數(shù)據(jù)庫如下(與MEGAN6
共用):
https://software-ab.informatik.uni-tuebingen.de/download/megan6/welcome.html
所以在參數(shù)文件中務(wù)必使用
taxRefSeqFile=
參數(shù)译仗,而非taxGIFile=
。
命令行運(yùn)行:
xvfb-run.sh --auto-servernum --server-num=1 /software/bin/MEGAN/MEGAN -L MEGAN/MEGAN5-academic-license.txt -g -E -c command.txt
# 或
xvfb-run.sh --auto-servernum --server-num=1 /software/bin/MEGAN/MEGAN -L MEGAN/MEGAN5-academic-license.txt -g -E < command.txt
使用xvfb
是為了虛擬化屏幕官觅,在Linux
上我們不想要MEGAN
顯示圖形界面纵菌,阻止窗口彈出,只要它在運(yùn)行就行了休涤。不過這個(gè)工具如果在你們集群平臺(tái)上沒裝咱圆,而你又沒root
權(quán)限的話,就得搗鼓半天了功氨。
運(yùn)行megan
這一步一開始生成rma
文件序苏,導(dǎo)出后可得到accessionID
和taxID
的對應(yīng)關(guān)系。
接下來可以寫個(gè)腳本通過Taxonomy
數(shù)據(jù)庫(下載地址)中的names.dmp
和nodes.dmp
文件得到物種注釋的結(jié)果了疑故。
MEGAN 6
MEGAN6
有Community Edition
和Ultimate Edition
兩個(gè)版本(download)杠览,因?yàn)楹笳咝枰?code>license key,我試了下社區(qū)版的纵势,貌似不支持Linux
平臺(tái)踱阿。
$ sh MEGAN_Community_unix_6_17_0.sh
No suitable Java Virtual Machine could be found on your system.
The version of the JVM must be at least 11.
Please define INSTALL4J_JAVA_HOME to point to a suitable JVM.
最終版本的MEGAN6
命令行模式后續(xù)如果有需求再試試吧管钳,應(yīng)該和5
差不多,因?yàn)閮烧叩臄?shù)據(jù)庫文件都通用了软舌。具體可參考MEGAN6 Manual才漆。
Ref:
http://mp.weixin.qq.com/s?__biz=MzIwNTEwMTUyOQ==&mid=2649693810&idx=2&sn=0264e78fac1dc6ffd3b8a3f6027e3669&chksm=8f2dbec4b85a37d23526e1996837f5f1ebcd41c220dde631855e6d27278c349fc1890ff45aba&scene=4#wechat_redirec
http://megan.informatik.uni-tuebingen.de/t/welcome-to-megan-metagenome-analyzer-community/8
http://blog.sina.com.cn/s/blog_83f77c940102wh7j.html
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1800929/pdf/377.pdf