IQ-TREE的使用 - 超快速用極大似然法構(gòu)建進(jìn)化樹

寫在前面

我知道IQ-tree已經(jīng)有很長(zhǎng)一段時(shí)間了揪罕。不過我一直并沒有使用它记餐。主要原因是译隘,常用的快速構(gòu)建ML樹的軟件是FastTree,如果要求準(zhǔn)確梆造,我會(huì)在服務(wù)器上使用RaxML缴守。所以是用不到。不過镇辉,使用IQ-tree可能最大的好處是屡穗,他支持直接估算替代模型。確實(shí)會(huì)省事許多忽肛。由于最近相對(duì)有多一點(diǎn)時(shí)間村砂,那么我就查閱并記錄一下IQ-tree的文檔。

程序下載位置

IQ-tree官方現(xiàn)在似乎只提供多線程版本....

http://www.iqtree.org/#download

如果你趕時(shí)間屹逛,那么直接翻到最后础废。

簡(jiǎn)單構(gòu)建進(jìn)化樹

iqtree -s example.phy

其中-s參數(shù)跟的是輸入的多序列比對(duì)結(jié)果。運(yùn)行這個(gè)命令會(huì)產(chǎn)生兩個(gè)輸出文件
example.phy.iqtree記錄相對(duì)具體的進(jìn)化樹構(gòu)建信息罕模。
example.phy.treefile記錄構(gòu)建成的進(jìn)化樹的newick文本评腺,這個(gè)應(yīng)該是最重要的輸出文件
example.phy.log主要用于給軟件作者debug。

作者在文檔里提到

從版本1.5.4開始淑掌,默認(rèn)自動(dòng)估算最優(yōu)替代模型

這是一個(gè)非常機(jī)智的操作....

IQ-tree運(yùn)行過程會(huì)保存每一步成功運(yùn)行的結(jié)果蒿讥,或者說他是運(yùn)行中斷并從斷點(diǎn)重新開始的。這個(gè)對(duì)于大數(shù)據(jù)集是有很大好處的抛腕。不過有時(shí)候芋绸,我們就是想從頭開始,那么需要加上參數(shù)-redo担敌。

iqtree -s example.phy -redo

默認(rèn)情況下IQ-tree的輸出文件名字以輸入的alignment文件為前綴摔敛。我們可以對(duì)其進(jìn)行修改,使用-pre參數(shù)

iqtree -s example.phy -pre myprefix

不過事實(shí)上柄错,我覺得完全沒必要舷夺。除非你要不斷的調(diào)整建樹的參數(shù)苦酱。

選擇合適的替代模型

IQ-tree支持多種不同輸入數(shù)據(jù)的替代模型選擇售貌,包括

  • DNA
  • protein
  • codon
  • binary
  • morphological

通過設(shè)置參數(shù)-m MFP使其自動(dòng)測(cè)試并選擇最優(yōu)替代模型

iqtree -s example.phy -m MFP

這個(gè)參數(shù)其實(shí)已經(jīng)可以不用給了给猾,上述說過,會(huì)默認(rèn)執(zhí)行颂跨。
一旦執(zhí)行最優(yōu)替代模型的預(yù)測(cè)敢伸,那么就會(huì)多輸出一個(gè)文件,
example.phy.model記錄了所有模型的似然信息恒削。
事實(shí)上池颈,最優(yōu)替代模型的信息會(huì)記錄 example.phy.iqtree中。如果是完全相同的多序列比對(duì)結(jié)果钓丰,那么最優(yōu)替代模型也是相同的躯砰。如果并沒有改變過,那么完全可以指定替代模型携丁,比如已知最優(yōu)替代模型為TIM2+I+G琢歇。那么可以執(zhí)行下述命令

iqtree -s example.phy -m TIM2+I+G

當(dāng)然,有時(shí)候梦鉴,你只是想看看最優(yōu)替代模型是啥李茫,而不想構(gòu)建進(jìn)化樹,畢竟后者相對(duì)耗時(shí)肥橙。那么可以執(zhí)行

iqtree -s example.phy -m MF

如果計(jì)算資源允許魄宏,那么最好的方式是增加參數(shù)-mtree,這樣會(huì)檢查所有可用模型

iqtree -s example.phy -m MF -mtree

如果你的輸入數(shù)據(jù)是SNP數(shù)據(jù)存筏,那么需要加上+ASC

iqtree -s SNP_data.phy -m MFP+ASC

當(dāng)然宠互,基于傳言和個(gè)人經(jīng)驗(yàn),在SNP數(shù)據(jù)上椭坚,似乎NJ法的表現(xiàn)就是由于ML法予跌。

使用超快bootstrap法評(píng)估分支支持度

真實(shí)的進(jìn)化信息只有一個(gè),而我們總是拿著有限的序列信息藕溅,希望去獲得他匕得。能否獲得他,是一個(gè)問題巾表。而我們使用的序列信息是否能真實(shí)且穩(wěn)定地反應(yīng)一個(gè)進(jìn)化信息汁掠,那么是另外一個(gè)事情。bootstrap法常用的集币,尤其是ML法構(gòu)建進(jìn)化樹上考阱,分支可靠性檢驗(yàn)方法。但是這個(gè)計(jì)算邏輯最大的問題在于鞠苟,抽樣重新跑乞榨,抽樣再重新跑秽之,不斷重復(fù),直到收斂或者是到指定的比如1000次吃既。計(jì)算量大考榨,耗時(shí)長(zhǎng)。IQ-tree的作者團(tuán)隊(duì)在前述提出了一個(gè)快速的BS方法鹦倚,最后整合到IQ-tree中河质。使用的方式是

iqtree -s example.phy -m TIM2+I+G -bb 1000

注意到:

  1. -m TIM2+I+G 是因?yàn)橐呀?jīng)指定了替代模型
  2. -bb 1000 指定了要用快速BS法做1000次

在這些參數(shù)下,輸出文件example.phy.iqtree中會(huì)增加一個(gè)MAXIMUM LIKELIHOOD TREE部分震叙,其中記錄了具體BS結(jié)果掀鹅。對(duì)應(yīng)的newick文本則可以在example.phy.treefile中找到。
此外媒楼,會(huì)增加三個(gè)輸出文件

  1. example.phy.contree記錄了一致樹乐尊,我個(gè)人認(rèn)為這個(gè)用處不到,事實(shí)上划址,一致樹我覺得主要是好看....
  2. example.phy.splits....
  3. example.phy.splits.nex... 與第2個(gè)文件具體信息類同

作者提醒到

快速BS法的具體解讀與常規(guī)的BS法有不同扔嵌,用戶需要知曉。

我個(gè)人事實(shí)上在很早的時(shí)候猴鲫,其實(shí)試過IQ-tree对人,但是兩三套數(shù)據(jù)下來,自認(rèn)為其表現(xiàn)不如RaxML拂共,于是沒有使用牺弄。作者在文檔中提到,模型沖突的情況下宜狐,快速BS會(huì)高估BS值势告,推薦加上參數(shù)-bnni。于是抚恒,命令是

iqtree -s example.phy -m TIM2+I+G -bb 1000 -bnni

當(dāng)然咱台,作者仍然提供正常的BS參數(shù),也就是不要-bb俭驮,而只用-b回溺。或許我們不趕時(shí)間的情況下混萝,可以使用

iqtree -s example.phy -m TIM2+I+G -b 100

此外遗遵,IQ-tree還支持其他的支持度估算方法
SH-like

iqtree -s example.phy -m TIM2+I+G -alrt 1000

你甚至可以同時(shí)進(jìn)行兩種分支支持度的計(jì)算,

iqtree -s example.phy -m TIM2+I+G -alrt 1000 -bb 1000

嗯逸嘀,作為一個(gè)基本不怎么做進(jìn)化分析的车要,我似乎覺得有BS就足夠了,畢竟這個(gè)似乎才是最多人care的崭倘。

使用多線程

Emm... 我以為iqtree本身是直接支持多線程翼岁,但是似乎從文檔來看类垫,是需要另外的一個(gè)iqtree版本,iqtree-omp琅坡。

iqtree -omp -s example.phy -m TIM2+I+G -nt 2

注意到悉患,只有在長(zhǎng)的比對(duì)結(jié)果下,使用多線程才會(huì)更有效脑蠕。最好的方式是讓IQtree自行定奪

iqtree -omp -s example.phy -m TIM2+I+G -nt AUTO

不過目前應(yīng)該是官方就有編譯的支持多線程的购撼。

寫在后面

總結(jié)跪削,使用IQ-tree構(gòu)建進(jìn)化樹的一步法谴仙,可能是

iqtree -s example.phy -m MFP -bb 1000  -bnni  -redo

最后查看結(jié)果文件example.phy.treefile
如果你擔(dān)心快速BS效果不好碾盐,那么考慮使用

iqtree -s example.phy -m MFP -b 1000  -redo

如果你的序列足夠長(zhǎng)晃跺,那么文檔建議增加-cmax,默認(rèn)是10毫玖,這主要是計(jì)算資源的問題掀虎。

iqtree -s example.phy -m MFP -bb 1000  -bnni -cmax 15  -redo

當(dāng)然,很多時(shí)候是需要增加多線程支持參數(shù)付枫,如下

iqtree -s example.phy -m MFP -bb 1000  -bnni  -nt AUTO  -cmax 15  -redo 
# 或者 
iqtree -s example.phy -m MFP -b 1000  -nt AUTO  -cmax 15  -redo 
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末烹玉,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子阐滩,更是在濱河造成了極大的恐慌二打,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件掂榔,死亡現(xiàn)場(chǎng)離奇詭異继效,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)装获,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門瑞信,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人穴豫,你說我怎么就攤上這事凡简。” “怎么了精肃?”我有些...
    開封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵秤涩,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我肋杖,道長(zhǎng)溉仑,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任状植,我火速辦了婚禮浊竟,結(jié)果婚禮上怨喘,老公的妹妹穿的比我還像新娘。我一直安慰自己振定,他們只是感情好必怜,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著后频,像睡著了一般梳庆。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上卑惜,一...
    開封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天膏执,我揣著相機(jī)與錄音,去河邊找鬼露久。 笑死更米,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的毫痕。 我是一名探鬼主播征峦,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼消请!你這毒婦竟也來了栏笆?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤臊泰,失蹤者是張志新(化名)和其女友劉穎蛉加,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體因宇,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡七婴,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了察滑。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片打厘。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖贺辰,靈堂內(nèi)的尸體忽然破棺而出户盯,到底是詐尸還是另有隱情,我是刑警寧澤饲化,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布牙肝,位于F島的核電站毙死,受9級(jí)特大地震影響茁裙,放射性物質(zhì)發(fā)生泄漏渊抄。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一巢块、第九天 我趴在偏房一處隱蔽的房頂上張望礁阁。 院中可真熱鬧巧号,春花似錦、人聲如沸姥闭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽棚品。三九已至靠欢,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間铜跑,已是汗流浹背门怪。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留疼进,地道東北人薪缆。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像伞广,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子疼电,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容