IQ-TREE最大似然法構(gòu)建系統(tǒng)發(fā)育樹的神器

http://www.reibang.com/p/df234ca0de71

IQ-TREE:最大似然法構(gòu)建精確常遂、快速酪呻、靈活、廣泛的系統(tǒng)發(fā)育樹

IQ-TREE自2011年就已經(jīng)開發(fā)并開源斑举,至今都有專業(yè)團(tuán)隊(duì)維護(hù),其名字來源于IQPNNI和TREE-PUZZLE的前綴,IQ-TREE具有四大特征:

  • 算法高效,通過最大似然法高速高效隨機(jī)重建系統(tǒng)發(fā)育樹描睦,如RAxMl和PhyML相比類似計(jì)算時(shí)間具有較好的結(jié)果
  • 超快的支持率,自檢值(bootstrap)是RAxML的10-40倍导而,同時(shí)出現(xiàn)偏見支持率值更少
  • 數(shù)據(jù)分析忱叭,支持成千上萬條序列或比對(duì)位點(diǎn)的數(shù)據(jù)集分析
  • 系統(tǒng)發(fā)育樹測(cè)試,有SH-aLRT和aBayes測(cè)試進(jìn)化枝今艺,樹拓?fù)浣Y(jié)構(gòu)近似無偏見測(cè)試(approximately unbiased)

此外韵丑,IQ-TREE提供大量的構(gòu)建系統(tǒng)發(fā)育樹模型供選擇,包括四種:

  • common models: 所有常見的DNA洼滚,蛋白質(zhì)埂息,密碼子的替代模型,二元和形態(tài)數(shù)據(jù)之間的比率異質(zhì)性和確定偏差校正遥巴,例如SNP數(shù)據(jù)千康。
  • Partition models: 混合數(shù)據(jù)、不同基因位點(diǎn)铲掐、異質(zhì)性等分開的模型選擇
  • Mixture models: 完全自定義模型和經(jīng)驗(yàn)?zāi)P?/li>
  • Polymorphism-aware models: 考慮物種不完整的譜系分類以推測(cè)物種樹

簡(jiǎn)單測(cè)試

說明拾弃,現(xiàn)在軟件已經(jīng)更新到version2版本,我們默認(rèn)使用iqtree調(diào)用(新版本為iqtree2)摆霉,此外本文所述均是基于命令行操作豪椿,解釋不同選項(xiàng)及對(duì)應(yīng)參數(shù)作用,網(wǎng)頁版使用過于簡(jiǎn)單携栋,可點(diǎn)擊跳轉(zhuǎn)搭盾。
輸入文件格式:phylip、fasta婉支、nexus鸯隅、clustalw

# 參數(shù)s為指定輸入比對(duì)好的文件格式,為必備的向挖,1.5.4版本默認(rèn) -m MFP自動(dòng)尋找最適模型
iqtree -s example.phy 

結(jié)果文件包括三個(gè):
example.phy.iqtree:主要計(jì)算結(jié)果的報(bào)告文件蝌以,也包含最終構(gòu)建系統(tǒng)發(fā)育樹樹的文本展示
example.phy.treefile:NEWICK格式的ML tree,該文件可用Figtree和iTOL查看
example.phy.log:整個(gè)運(yùn)行過程的日志文件何之,記錄報(bào)錯(cuò)等信息
注意:在運(yùn)行的過程中跟畅,程序會(huì)定期將執(zhí)行進(jìn)程(結(jié)果)寫入一個(gè)gzip壓縮的example.phy.ckp.gz文件,該文件可以在出現(xiàn)程序運(yùn)行終止或遇到較大文件而內(nèi)存不足時(shí)溶推,再次使用相同的命令運(yùn)行IQ-TREE徊件,程序?qū)?huì)從上次停止的地方繼續(xù)運(yùn)行奸攻。當(dāng)然對(duì)運(yùn)行完成的結(jié)果,再次運(yùn)行會(huì)顯示當(dāng)前任務(wù)已經(jīng)成功運(yùn)行庇忌。
-redo選項(xiàng)表示覆蓋運(yùn)行之前的結(jié)果舞箍,如

iqtree -s example.phy -redo

-pre選項(xiàng)舰褪,自定義輸出結(jié)果文件前綴皆疹,默認(rèn)情況下所有輸出文件的前綴與輸入文件的名字一致,如指定myprefix為前綴:

iqtree -s example.phy -pre myprefix

如何選擇最適合模型

IQ-TREE支持針對(duì)DNA占拍、protein略就、codon等大量的模型可供選擇,但是通常情況下晃酒,我們不知道哪個(gè)模型最適合我們的數(shù)據(jù)表牢,而調(diào)用軟件內(nèi)置ModelFinder確定最合適的模型。

#for IQ-TREE version >= 1.5.4:
iqtree -s example.phy -m MFP # -m 指定模型選項(xiàng)贝次,MFP表示ModelFinder Plus(自動(dòng)默認(rèn))
#for IQ-TREE version <= 1.5.3:
iqtree -s example.phy -m TESTNEW

MFPModelFinder Plus的縮寫崔兴,該參數(shù)使程序執(zhí)行ModelFinder選擇最適模型并完成建樹分析。ModelFinder為許多不同的模型計(jì)算初始簡(jiǎn)約樹的邏輯概率蛔翅,并產(chǎn)生Akaike
information criterion
(AIC),* corrected Akaike information criterion* (AICc), and* the Bayesian information criterion* (BIC)三個(gè)結(jié)果標(biāo)準(zhǔn)值敲茄,通常ModelFinder選擇BIC分?jǐn)?shù)最低的模型(當(dāng)然也可以指定AIC和AICc通過指定選項(xiàng)-AIC或者-AICc)。
此時(shí)會(huì)增加一個(gè)額外輸出結(jié)果文件:
example.phy.model:所有測(cè)試模型的對(duì)數(shù)概率值山析,它充當(dāng)檢查點(diǎn)文件堰燎,用于恢復(fù)中斷的模型選擇。
有時(shí)笋轨,我們僅僅只想知道數(shù)據(jù)分析的最適合模型并不想建樹秆剪,那么可以分別指定MFTESTNEWONLY參數(shù)
值得注意一下,我們這里選擇ModelFinder而不調(diào)用jModelTest/ProTest爵政,其優(yōu)點(diǎn)如下:(如果仍然想用jModelFinder/ProTest仅讽,添加-m TEST或者-m TESTONLY)

image

如果序列比對(duì)文件特別長(zhǎng)(考慮添加-cmax 15,默認(rèn)為10)

用超快的bootstrap近似評(píng)估分支支持值

為了克服非參數(shù)bootstrap所需的計(jì)算負(fù)擔(dān)钾挟,IQTREE引入了ultrafast bootstrap approximation (UFBoot)提供相對(duì)公正的分支支持?jǐn)?shù)值洁灵,選項(xiàng)為- bb通常為百分比數(shù)值。

iqtree -s example.phy -m TIM2+I+G -bb 1000

與前面相比等龙,又額外增加三個(gè)輸出結(jié)果文件:
example.phy.contree:樹支持值一致的樹(consensus tree)的且分支長(zhǎng)度在原始比對(duì)上優(yōu)化過
example.phy.splits.nex:所有分割(雙分區(qū))的支持值的百分比处渣,作為引導(dǎo)樹中出現(xiàn)的頻率計(jì)算,該文件可以通過程序SplitsTree查看數(shù)據(jù)中的矛盾信號(hào)蛛砰,因此因此罐栈,該文件一致樹更能提供信息
example.phy.splits (使用-wsplits選項(xiàng)):此文件包含與example.phy.split相同的信息,格式為star-dot泥畅。
有時(shí)荠诬,-bnni減少由于嚴(yán)重的模型違規(guī)而高估了UFBoot對(duì)分支的支持風(fēng)險(xiǎn)。

評(píng)估分枝支持率使用標(biāo)準(zhǔn)的分參數(shù)bootstrap

iqtree -s example.phy -m TIM2+I+G -b 100

-b指定bootstrap的重復(fù)次數(shù),其中100為推薦的推薦的最小數(shù)柑贞。輸出結(jié)果文件與UFBoot過程生成的文件相似方椎。

使用單個(gè)分枝測(cè)試評(píng)估分枝支持值

IQ-TREE提供一個(gè)SH類近似似然比測(cè)試,-alrt指定SH-aLRT的bootstrap的重復(fù)個(gè)數(shù)钧嘶,1000為最下的棠众。

iqtree -s example.phy -m TIM2+I+G -alrt 1000
iqtree -s example.phy -m TIM2+I+G -alrt 1000 -bb 1000

CPUs核心線程的利用

IQ-TREE可以利用多個(gè)CPU核來加速分析。選項(xiàng)-nt允許指定要使用的CPU內(nèi)核數(shù)量

iqtree -s example.phy -m TIM2+I+G -nt 2
iqtree -s example.phy -m TIM2+I+G -nt AUTO #通常使用這個(gè)
iqtree -s example.phy -m TIM2+I+G -nt AUTO -ntmax 8 #cpu的上限為8核心線程

后記有决,以上主要介紹了iqtree軟件關(guān)于輸入文件闸拿、輸出文件的介紹及解讀,同時(shí)詳細(xì)介紹了不同選項(xiàng)及參數(shù)的功能书幕。

關(guān)于特異性指定替換模型

-m是指定替代模型新荤、狀態(tài)頻率和速率異質(zhì)性類型的實(shí)用選項(xiàng)。一般的語法是:

-m MODEL+FreqType+RateType

MODEL:model name
+FreqType:(可選項(xiàng))frequency type
+RateType:(可選項(xiàng))rate heterogeneity type

參見下圖:

MODEL:

image

FreqType:

image

RateType:

image

IQ-TREE官網(wǎng)鏈接:http://iqtree.cibiv.univie.ac.at/

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末台汇,一起剝皮案震驚了整個(gè)濱河市苛骨,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌苟呐,老刑警劉巖痒芝,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異掠抬,居然都是意外死亡吼野,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門两波,熙熙樓的掌柜王于貴愁眉苦臉地迎上來瞳步,“玉大人,你說我怎么就攤上這事腰奋〉テ穑” “怎么了?”我有些...
    開封第一講書人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵劣坊,是天一觀的道長(zhǎng)嘀倒。 經(jīng)常有香客問我,道長(zhǎng)局冰,這世上最難降的妖魔是什么测蘑? 我笑而不...
    開封第一講書人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮康二,結(jié)果婚禮上碳胳,老公的妹妹穿的比我還像新娘。我一直安慰自己沫勿,他們只是感情好挨约,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開白布味混。 她就那樣靜靜地躺著,像睡著了一般诫惭。 火紅的嫁衣襯著肌膚如雪翁锡。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,708評(píng)論 1 305
  • 那天夕土,我揣著相機(jī)與錄音馆衔,去河邊找鬼。 笑死隘弊,一個(gè)胖子當(dāng)著我的面吹牛哈踱,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播梨熙,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼刀诬!你這毒婦竟也來了咽扇?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤陕壹,失蹤者是張志新(化名)和其女友劉穎质欲,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體糠馆,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡嘶伟,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了又碌。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片九昧。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖毕匀,靈堂內(nèi)的尸體忽然破棺而出铸鹰,到底是詐尸還是另有隱情,我是刑警寧澤皂岔,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布蹋笼,位于F島的核電站,受9級(jí)特大地震影響躁垛,放射性物質(zhì)發(fā)生泄漏剖毯。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一教馆、第九天 我趴在偏房一處隱蔽的房頂上張望逊谋。 院中可真熱鬧,春花似錦活玲、人聲如沸涣狗。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽镀钓。三九已至穗熬,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間丁溅,已是汗流浹背唤蔗。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留窟赏,地道東北人妓柜。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像涯穷,于是被迫代替她去往敵國(guó)和親棍掐。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容