更多內(nèi)容關(guān)注微信公眾號(hào):“今日之森”? ?后獲取描睦。
“好看的皮囊千篇一律窝剖,有趣的靈魂萬(wàn)里挑一”
進(jìn)化樹的構(gòu)建絕不僅僅是將一堆序列扔進(jìn)MEGA等建樹軟件,隨便生成樹那么簡(jiǎn)單,因?yàn)榭傮w上隨著論文圖片質(zhì)量的不斷提高钓株,構(gòu)建系統(tǒng)進(jìn)化樹更不能將就,好看又能清晰說(shuō)明問(wèn)題的進(jìn)化樹或許不會(huì)加分渤昌,但絕不能減分恒傻。
相信大多數(shù)低年級(jí)的研究生都會(huì)構(gòu)建進(jìn)化樹,但對(duì)于進(jìn)化樹的美化就不怎么了解了畏纲。
好扇住,下面就簡(jiǎn)單介紹一下關(guān)于系統(tǒng)發(fā)育樹的構(gòu)建與美化。
正式開始之前先來(lái)了解了解建樹并美化的基本流程:
?獲取數(shù)據(jù)
獲取需要進(jìn)行系統(tǒng)發(fā)育分析的序列盗胀,fasta格式台囱;
考究序列差異性,若序列所含結(jié)構(gòu)域高度保守读整,且長(zhǎng)度基本一致簿训,則直接進(jìn)行多序列比對(duì),以比對(duì)后的文件選擇合適的模型建樹即可米间;若序列中所含結(jié)構(gòu)域多種多樣强品,且序列長(zhǎng)短不一,就需要考察序列中是否有唯一或幾個(gè)較為保守的結(jié)構(gòu)域屈糊,如有的榛,則需要根據(jù)情況提取每條序列中的保守結(jié)構(gòu)域進(jìn)行基于結(jié)構(gòu)域序列的系統(tǒng)發(fā)育樹構(gòu)建,如僅有個(gè)別序列過(guò)長(zhǎng)過(guò)短逻锐,則需要單獨(dú)進(jìn)行結(jié)構(gòu)與分析夫晌,選擇保留或舍棄∶劣眨總之需要選擇盡可能準(zhǔn)確的策略進(jìn)行建樹晓淀。若出現(xiàn)序列參差不齊,且無(wú)明顯的規(guī)律(包含唯一或幾個(gè)保守結(jié)構(gòu)域)盏档,但又都需保留的情況下則需要在進(jìn)行多序列比對(duì)后刪除gap或刪掉差異過(guò)大的區(qū)間凶掰。然后再進(jìn)行建樹。
3.1?基于距離:
??UPGMA(類平均法)
??ME(Minimum Evolution蜈亩,最小進(jìn)化法)
??NJ(Neighbor-Joining懦窘,鄰接法)
? ? ? ?3.2基于特征:
???MP(Maximum parsimony,最大簡(jiǎn)約法)
???ML(Maximum likelihood稚配,最大似然法)
???Bayesian Inference (BI畅涂,貝葉斯方法)
? ? 4.系統(tǒng)發(fā)育樹的構(gòu)建
? ??5.系統(tǒng)發(fā)育樹的編輯與美化
一、進(jìn)化樹的構(gòu)建
1 MEGA軟件https://www.megasoftware.net/
想必都用過(guò)MEGA道川,這應(yīng)該大多數(shù)研究生建樹最常用到的軟件了午衰。
先來(lái)看昨天基因家族成員確定②提到的那篇文章中的系統(tǒng)發(fā)育樹苹丸,總體來(lái)看還是可以的,但是這樣一個(gè)進(jìn)化樹如果強(qiáng)行用MEGA來(lái)美化就有點(diǎn)吃力了苇经,所以先來(lái)建樹赘理。
2 開始操作
2.1 獲取數(shù)據(jù)
獲取數(shù)據(jù)的方式多種多樣,由于上一篇推文已經(jīng)獲取到馬鈴薯hsp20基因的蛋白序列扇单,也提取到擬南芥hsp20基因的序列商模,因此就作為今天的建樹序列文件。
2.2 多序列比對(duì)
關(guān)于多序列比對(duì)蜘澜,這里只介紹兩個(gè)軟件施流,一是MEGA,雖然該軟件操作簡(jiǎn)單鄙信,也集成了Clustalw和Muscle(如下圖)瞪醋,但適合配置一般的電腦進(jìn)行少于500條以內(nèi)的多序列比對(duì)(經(jīng)驗(yàn)之談);二是mafft装诡,需要基于命令行操作银受,但tbtools中好像也集成了mafft,感興趣的可以去研究鸦采,mafft的最大優(yōu)勢(shì)是可以快速進(jìn)行幾千條序列的比對(duì)宾巍,是我用過(guò)最快的多序列比對(duì)軟件,當(dāng)然還有其他優(yōu)勢(shì)渔伯。
將馬鈴薯和擬南芥hsp20基因蛋白序列用MEGA打開后顶霞,我們這里選擇Muscle進(jìn)行多序列比對(duì)。比對(duì)結(jié)果如下:
以下三張多序列比對(duì)均只截取起始位置的界面锣吼。
從這個(gè)比對(duì)結(jié)果來(lái)看选浑,差異是非常之大,由于序列較少玄叠,繼續(xù)建樹應(yīng)該影響不大古徒。但我們還是單獨(dú)看一下擬南芥和馬鈴薯各自的比對(duì)結(jié)果。
擬南芥
馬鈴薯
可以看出诸典,這樣的結(jié)果使我們不想要的描函,但是由于序列較少,基本不影響建樹的準(zhǔn)確性狐粱。但是為了進(jìn)一步。我們需要進(jìn)行修剪多序列比對(duì)結(jié)果胆数,以構(gòu)建更準(zhǔn)確的進(jìn)化樹肌蜻。
先講MEGA多序列比對(duì)結(jié)果導(dǎo)出為fasta格式。然后打開tbtools必尼,使用Trimmer快速修剪蒋搜。
修建之后篡撵,就美好了很多,如下:
2.3?進(jìn)化樹構(gòu)建
這里選擇NJ模型進(jìn)行建樹豆挽。如下:
在保存的時(shí)候就出現(xiàn)一些bug育谬,總體來(lái)說(shuō)還是不習(xí)慣用MEGA來(lái)編輯和美化進(jìn)化樹。
因此在這里將樹文件導(dǎo)出
導(dǎo)出后生成以.nwk結(jié)尾的樹文件帮哈,這個(gè)文件可以用其他進(jìn)化樹美化軟件打開后進(jìn)行操作膛檀。
二、進(jìn)化樹的編輯與美化
用過(guò)兩款在線軟件娘侍,一是Evolview咖刃,二是iTOL。兩款都是在線軟件憾筏,最開始用Evolview嚎杨,很容易上手操作,但是個(gè)人感覺軟件功能較為單一氧腰,適合初學(xué)者進(jìn)行操作枫浙,后來(lái)就放棄使用了。iTOL就比較強(qiáng)大了古拴,建議注冊(cè)賬號(hào)自脯,這樣可以保留編輯記錄,以便后期查看斤富,這款軟件的強(qiáng)大之處在于可以配置各種自己所需的配置文件膏潮,使進(jìn)化樹更具個(gè)性。網(wǎng)址貼在這里满力,感興趣的自行探索焕参,下面使用iTOL進(jìn)行簡(jiǎn)單編輯。
Evolview:https://www.evolgenius.info/evolview/#login
iTOL:https://itol.embl.de/itol.cgi
好了油额,打開iTOL叠纷,界面如下:
可以看到右邊操作面板很人性化,可以通過(guò)點(diǎn)擊不同的選項(xiàng)進(jìn)行美化和編輯潦嘶。
先來(lái)上傳剛才生成的樹文件涩嚣。
這個(gè)無(wú)根樹,hhh……掂僵,看起來(lái)怎么有點(diǎn)像一只小動(dòng)物航厚,interesting!
由于這個(gè)例子只是做一示范锰蓬,并不想花很多精力去準(zhǔn)備配置文件做更為詳細(xì)的美化和編輯幔睬。
授人以魚不如授人以漁,這里直接推進(jìn)iTOL官網(wǎng)的help說(shuō)明文檔芹扭,https://itol.embl.de/help.cgi
配置文件不難準(zhǔn)備麻顶,根據(jù)個(gè)人需要準(zhǔn)備即可赦抖。尤其在顏色配置過(guò)程中還是蠻考驗(yàn)審美水平的,如果對(duì)顏色沒有超高理解的話還是盡量選擇高水平文章中的色彩搭配進(jìn)行練習(xí)并使用辅肾。
先寫到這里队萤。