6-【FasTtree厅篓、RAxML-NG、IQtree】的安裝和使用(2021.3.16更新)

初次記錄時間:2021.2.5


3.12更新說明:ML建樹對與模型的替代選擇比較敏感捶码,因此增加了第四部分推測最佳模型的方法:jModeltest和ProtTest羽氮。
3.16更新說明:增加了第五部分內容,IQtree可以幫助用戶選擇最佳的進化模型惫恼,速度也較快档押,有文獻報道準確度比傳統(tǒng)的RAxML高。
3.20更新說明:意外又看到一個推測最佳建樹模型的軟件:modeltest-ng祈纯。目前用不到汇荐,就暫時不用它了。另外盆繁,為啥我用IQtree建樹,那么慢QS桶骸!

1. 系統(tǒng)發(fā)生樹

1.1 簡述

????系統(tǒng)發(fā)生樹(Phylogenetic tree)是從分子層面研究物種進化的手段倾贰,是通過構建分子樹來推斷物種樹冕碟,并不一定是絕對的真實情況。隨著越來越多物種的基因序列的獲得匆浙,是一種快捷安寺、準確的研究物種間關系的方法。構建好的系統(tǒng)發(fā)生樹由四部分組成:根首尼、枝挑庶、節(jié)言秸、葉


系統(tǒng)發(fā)生樹結構圖

1.2 特點

  • 由系統(tǒng)發(fā)育樹推斷出的進化關系,并不一定是物種間絕對的進化關系迎捺。
  • 系統(tǒng)發(fā)育樹的分支聚類情況举畸,在一定程度上反映了物種間的親緣關系。
  • 系統(tǒng)發(fā)育樹分支繞節(jié)點轉動不會改變物種間的親緣關系凳枝。

FastTreeRAxML均是用最大似然法構建系統(tǒng)發(fā)育樹的工具抄沮,前者速度快,后者準確度高岖瑰。

2. FastTtree

????FastTtree采用的是SH檢驗來判斷每個節(jié)點的可信度叛买。該值的范圍在0~1之間,與一般用的bootstrap值高度相關蹋订。

2.1 安裝

conda install fasttree

2.2 使用

2.2.1 核酸建樹

fasttree -nt <nucleotide_alignment_file> > <tree_file>

注:核酸建樹默認JC+CAT模型率挣,可以用參數(shù)-gtr -nt切換成GTR+CAT模型

2.2.2 蛋白建樹

fasttree <protein_alignment_file> > <tree_file>

注:蛋白建樹默認JTT+CAT模型,還可以用參數(shù)-wag或者-lg切換成LG+CAT或者WAG+CAT模型


3. RAxML-NG

3.1 安裝

 conda install -c bioconda raxml-ng 

3.2 使用

第一步:檢查比對后的序列MSA是否可以讀雀ū纭(MSA可以使用FASTA难礼、PHYLIP格式)

raxml-ng --check --msa prim.phy --model GTR --prefix T1

注:這一步驟還會給出哪些序列是相同序列(推薦執(zhí)行)

第二步:構建核苷酸樹(模型GTR,1000次自檢值抽樣)

raxml-ng --all --msa prim.phy --model GTR --prefix T15 --threads 10  --bs-trees 1000

注:蛋白樹可用LG模型


4. 模型的選擇

????目前常用的構建系統(tǒng)發(fā)育樹的方法有:鄰位歸并法(Neighbor joining, NJ)玫锋、最大似然法(Maximum likelihood method, ML) 以及貝葉斯法(BI)蛾茉。綜合速度和準確度,ML用得較多撩鹿。
????ML對替代模型非常敏感谦炬,因此利用ML法構建系統(tǒng)發(fā)育樹之前,選擇合適的替代模型是必不可少的過程节沦。(如果序列的相似度較高键思,每種方法和模型構建的系統(tǒng)發(fā)育樹差別不大)

4.1 jModeltest

????jModeltest用于核苷酸最佳替代模型的計算,一共有88種模型甫贯。

4.1.1 安裝

????從github上下載最新版本(jModelTest v2.1.10)吼鳞。

4.1.2 使用

tar -zxvf jmodeltest-2.1.10.tar.gz
cd jmodeltest-2.1.10
java -jar jModelTest.jar -d <輸入文件.fa> -f -i -g 4 -s 11 -BIC -AIC -v -a -tr 40 -o <輸出結果.txt>

注:輸入文件為比對之后的fasta格式文件

4.2 ProtTest

????ProTest用于最佳氨基酸替代模型的計算,一共有120中模型叫搁。

4.2.1 安裝

????從github下載最新版本(ProtTest 3.4.2)

4.2.2 使用

1. 查看幫助信息

tar -zxvf prottest-3.4.2-20160508.tar.gz
cd prottest-3.4.2
java -jar prottest-3.4.2.jar -h

2. 模型預測

java -jar prottest-3.4.jar -i <輸入蛋白序列.phy> -all-distributions -F -AIC -BIC -tc 0.5 -threads 24 -o <輸出結果>

5. IQtree

5.1 安裝

conda install iqtree

5.2 使用

1. 只選擇合適的模型并輸出最佳的模型(類似于jModelTest)

iqtree -s example.phy -m MF -mtree -T AUTO

mtree:會檢查所有的模型赔桌,會占用很多的電腦資源。

2. 使用GTR+I+G模型建系統(tǒng)發(fā)育樹

iqtree -s example.phy -m GTR+I+G

3. 選擇合適的模型渴逻,并直接構建系統(tǒng)發(fā)育樹(常用)

  • 普通數(shù)量和序列大小建樹(用標準的bootstraps進行檢驗):
iqtree -s example.phy -m MFP -b 1000 -T AUTO
  • 數(shù)量較多或序列較長(用UFBoot進行檢驗):
iqtree -s example.phy -m MFP -B 1000 --bnni -T AUTO

常用參數(shù)說明:
1. -s:指定輸入比對后的序列文件名
2. -m:選擇模型(設置MFP會自動檢測最佳模型并建樹疾党,從v1.54版本開始,MFP已經(jīng)是默認的參數(shù)了)
2. -b:bootstrap次數(shù)
3. -B:超快速bootstrap次數(shù)惨奕,大于等于1000
4. --bnni:使用NNI優(yōu)化超快速bootstrap的樹雪位,搭配-B使用
5. -T:程序運行使用的核數(shù),可設置具體數(shù)字或者AUTO(推薦)梨撞,默認是1
6. -cmax:默認是10雹洗,如果序列很長香罐,可以適當增加該數(shù)值
7. -alrt 1000:進行SH-aLRT檢驗。

注意事項:

  1. ultrafast bootstrap(UFBoot)和一般的bootstrap值的區(qū)別是队伟,前者更加公正 (unbiased)穴吹。同時,兩者表示的意義也有區(qū)別嗜侮。UFBoot=95%港令,表示的是該分支的真實性是95%。一般來說锈颗,一個分支的BS(bootstrap)>80%顷霹,或者UFBoot>95%為可信的。
  2. 為了進一步增加可信度击吱,還在建樹的過程中可以增加SH-aLRT檢驗淋淀,(添加參數(shù):-alrt 1000)。SH-aLRT ≥ 80%覆醇,且UFBoot ≥ 95%時為可信的朵纷。
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市永脓,隨后出現(xiàn)的幾起案子袍辞,更是在濱河造成了極大的恐慌,老刑警劉巖常摧,帶你破解...
    沈念sama閱讀 216,591評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件搅吁,死亡現(xiàn)場離奇詭異,居然都是意外死亡落午,警方通過查閱死者的電腦和手機谎懦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,448評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來溃斋,“玉大人界拦,你說我怎么就攤上這事」=伲” “怎么了寞奸?”我有些...
    開封第一講書人閱讀 162,823評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長在跳。 經(jīng)常有香客問我,道長隐岛,這世上最難降的妖魔是什么猫妙? 我笑而不...
    開封第一講書人閱讀 58,204評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮聚凹,結果婚禮上割坠,老公的妹妹穿的比我還像新娘齐帚。我一直安慰自己,他們只是感情好彼哼,可當我...
    茶點故事閱讀 67,228評論 6 388
  • 文/花漫 我一把揭開白布对妄。 她就那樣靜靜地躺著,像睡著了一般敢朱。 火紅的嫁衣襯著肌膚如雪剪菱。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,190評論 1 299
  • 那天拴签,我揣著相機與錄音孝常,去河邊找鬼。 笑死蚓哩,一個胖子當著我的面吹牛构灸,可吹牛的內容都是我干的。 我是一名探鬼主播岸梨,決...
    沈念sama閱讀 40,078評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼喜颁,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了曹阔?” 一聲冷哼從身側響起半开,我...
    開封第一講書人閱讀 38,923評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎次兆,沒想到半個月后稿茉,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,334評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡芥炭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,550評論 2 333
  • 正文 我和宋清朗相戀三年漓库,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片园蝠。...
    茶點故事閱讀 39,727評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡渺蒿,死狀恐怖,靈堂內的尸體忽然破棺而出彪薛,到底是詐尸還是另有隱情茂装,我是刑警寧澤,帶...
    沈念sama閱讀 35,428評論 5 343
  • 正文 年R本政府宣布善延,位于F島的核電站少态,受9級特大地震影響,放射性物質發(fā)生泄漏易遣。R本人自食惡果不足惜彼妻,卻給世界環(huán)境...
    茶點故事閱讀 41,022評論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧侨歉,春花似錦屋摇、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,672評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至牵舵,卻和暖如春柒啤,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背棋枕。 一陣腳步聲響...
    開封第一講書人閱讀 32,826評論 1 269
  • 我被黑心中介騙來泰國打工白修, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人重斑。 一個月前我還...
    沈念sama閱讀 47,734評論 2 368
  • 正文 我出身青樓兵睛,卻偏偏與公主長得像,于是被迫代替她去往敵國和親窥浪。 傳聞我的和親對象是個殘疾皇子祖很,可洞房花燭夜當晚...
    茶點故事閱讀 44,619評論 2 354

推薦閱讀更多精彩內容