網(wǎng)絡(luò)上關(guān)于構(gòu)建進化樹的教程非常多座舍,這里只挑重點部分講解熔号。
常見算法:Neighbor-Joining依痊、Maximum Likelihood
1. 參數(shù)設(shè)置:
Test of Phylogeny:建樹的檢驗方法
常用Boot strap method (步長檢驗)
是根據(jù)所選的建樹方法蛙酪,計算并繪制指定次數(shù)棵系統(tǒng)發(fā)育樹齐苛。大多數(shù)建樹方法的核心算法都是統(tǒng)計概率模型,所以每次算出的數(shù)都會有所差別桂塞,用Boot strap method檢驗方法凹蜂,建好的系統(tǒng)發(fā)育樹上每個節(jié)點上都會標(biāo)記一個數(shù)字,代表了指定次數(shù)次計算所得出的系統(tǒng)發(fā)育樹中有百分之幾的樹都有這一節(jié)點阁危。絕大多數(shù)節(jié)點數(shù)值大于70%的樹才可信玛痊,個別低于70%也可忽略。也可以通過增刪序列來改善質(zhì)量狂打。
No. of Bootstrap Replications:一般設(shè)置步長為500-1000擂煞;
Substitution Model :計算遺傳距離時使用的計算模型
Model/Method: p-distance
理論上需嘗試各種模式,然后選擇合適的模型進行計算趴乡。實際操作中通常選擇距離模型对省,如p-distance即可蝗拿。
Gaps/Missing Data Treatment:
刪除多序列比對中含有空位的列,遺傳距離度量方法不同蒿涎,刪減原則不同蛹磺;
如序列間不同殘基個數(shù)來度量遺傳距離,則選擇complete deletion 同仆;
如采用Neighbor-Joining萤捆,則選擇Partial deletion部分刪除,刪除程度保持50%俗批。
2. 生成進化樹
左側(cè)標(biāo)簽頁:
原始樹:步長檢驗時構(gòu)建1000棵樹中的一個俗或。未經(jīng)過多棵樹合并,樹的長短可精確代表遺傳距離岁忘。
右側(cè)標(biāo)簽頁:
步長檢驗合并樹辛慰,樹上節(jié)點處數(shù)字表示經(jīng)過步長檢驗,有x%個樹都具有這個數(shù)支干像。反應(yīng)了樹支的可信度
3. 樹形美化:
View > Options
更改樹支形狀或根等:
導(dǎo)出為矢量格式帅腌,如pdf 或EMF,添加到AI中進行下一步美化麻汰,呈現(xiàn)效果如下:
4. 遺傳距離計算
"Distance" > "compute pairwise Distances"
設(shè)置參數(shù)如上速客,繼續(xù)下一步
5. 文件保存
- 序列比對的結(jié)果保存:
"data" > "save session ",文件后綴名為.mas
打開文件:"Align" > "Open saved Alignment session"
"Export Alignment" > "MEGA Format"五鲫,文件后綴名為.meg
打開文件:雙擊文件即可打卡
- 進化樹保存
"File" > "Save current session" 溺职,文件后綴名為.MTS
打開:"User Tree" > "Open Tree Session"
Display Newick Trees,文件后綴名為.nwk
"File" > "Export current Tree (Newick)"
注意位喂,打開的nwk文件只有整合后樹文件浪耘,而沒有源樹支。nwk文件可以導(dǎo)入其他在線的進化樹美化網(wǎng)站做進一步地修飾塑崖。
- 導(dǎo)出圖片:
"image" 選擇導(dǎo)出EMF PDF PNG格式的圖片七冲。
參考資料: