基因家族分析(1)——進(jìn)化樹構(gòu)建與美化

更多內(nèi)容關(guān)注微信公眾號(hào):“今日之森”? ?后獲取描睦。


“好看的皮囊千篇一律窝剖,有趣的靈魂萬(wàn)里挑一”

進(jìn)化樹的構(gòu)建絕不僅僅是將一堆序列扔進(jìn)MEGA等建樹軟件,隨便生成樹那么簡(jiǎn)單,因?yàn)榭傮w上隨著論文圖片質(zhì)量的不斷提高钓株,構(gòu)建系統(tǒng)進(jìn)化樹更不能將就,好看又能清晰說(shuō)明問(wèn)題的進(jìn)化樹或許不會(huì)加分渤昌,但絕不能減分恒傻。

相信大多數(shù)低年級(jí)的研究生都會(huì)構(gòu)建進(jìn)化樹,但對(duì)于進(jìn)化樹的美化就不怎么了解了畏纲。

好扇住,下面就簡(jiǎn)單介紹一下關(guān)于系統(tǒng)發(fā)育樹的構(gòu)建與美化。

正式開始之前先來(lái)了解了解建樹并美化的基本流程:

  • ?獲取數(shù)據(jù)

    獲取需要進(jìn)行系統(tǒng)發(fā)育分析的序列盗胀,fasta格式台囱;

  • 多序列比對(duì)

    考究序列差異性,若序列所含結(jié)構(gòu)域高度保守读整,且長(zhǎng)度基本一致簿训,則直接進(jìn)行多序列比對(duì),以比對(duì)后的文件選擇合適的模型建樹即可米间;若序列中所含結(jié)構(gòu)域多種多樣强品,且序列長(zhǎng)短不一,就需要考察序列中是否有唯一或幾個(gè)較為保守的結(jié)構(gòu)域屈糊,如有的榛,則需要根據(jù)情況提取每條序列中的保守結(jié)構(gòu)域進(jìn)行基于結(jié)構(gòu)域序列的系統(tǒng)發(fā)育樹構(gòu)建,如僅有個(gè)別序列過(guò)長(zhǎng)過(guò)短逻锐,則需要單獨(dú)進(jìn)行結(jié)構(gòu)與分析夫晌,選擇保留或舍棄∶劣眨總之需要選擇盡可能準(zhǔn)確的策略進(jìn)行建樹晓淀。若出現(xiàn)序列參差不齊,且無(wú)明顯的規(guī)律(包含唯一或幾個(gè)保守結(jié)構(gòu)域)盏档,但又都需保留的情況下則需要在進(jìn)行多序列比對(duì)后刪除gap或刪掉差異過(guò)大的區(qū)間凶掰。然后再進(jìn)行建樹。

  • 進(jìn)化模型的選擇

    3.1?基于距離:

  • ??UPGMA(類平均法)

  • ??ME(Minimum Evolution蜈亩,最小進(jìn)化法)

  • ??NJ(Neighbor-Joining懦窘,鄰接法)

  • ? ? ? ?3.2基于特征:

  • ???MP(Maximum parsimony,最大簡(jiǎn)約法)

  • ???ML(Maximum likelihood稚配,最大似然法)

  • ???Bayesian Inference (BI畅涂,貝葉斯方法)

  • ? ? 4.系統(tǒng)發(fā)育樹的構(gòu)建

    ? ??5.系統(tǒng)發(fā)育樹的編輯與美化


    一、進(jìn)化樹的構(gòu)建

    1 MEGA軟件https://www.megasoftware.net/

    想必都用過(guò)MEGA道川,這應(yīng)該大多數(shù)研究生建樹最常用到的軟件了午衰。

    先來(lái)看昨天基因家族成員確定②提到的那篇文章中的系統(tǒng)發(fā)育樹苹丸,總體來(lái)看還是可以的,但是這樣一個(gè)進(jìn)化樹如果強(qiáng)行用MEGA來(lái)美化就有點(diǎn)吃力了苇经,所以先來(lái)建樹赘理。

    2 開始操作

    2.1 獲取數(shù)據(jù)

    獲取數(shù)據(jù)的方式多種多樣,由于上一篇推文已經(jīng)獲取到馬鈴薯hsp20基因的蛋白序列扇单,也提取到擬南芥hsp20基因的序列商模,因此就作為今天的建樹序列文件。

    2.2 多序列比對(duì)

    關(guān)于多序列比對(duì)蜘澜,這里只介紹兩個(gè)軟件施流,一是MEGA,雖然該軟件操作簡(jiǎn)單鄙信,也集成了Clustalw和Muscle(如下圖)瞪醋,但適合配置一般的電腦進(jìn)行少于500條以內(nèi)的多序列比對(duì)(經(jīng)驗(yàn)之談);二是mafft装诡,需要基于命令行操作银受,但tbtools中好像也集成了mafft,感興趣的可以去研究鸦采,mafft的最大優(yōu)勢(shì)是可以快速進(jìn)行幾千條序列的比對(duì)宾巍,是我用過(guò)最快的多序列比對(duì)軟件,當(dāng)然還有其他優(yōu)勢(shì)渔伯。

    將馬鈴薯和擬南芥hsp20基因蛋白序列用MEGA打開后顶霞,我們這里選擇Muscle進(jìn)行多序列比對(duì)。比對(duì)結(jié)果如下:

    以下三張多序列比對(duì)均只截取起始位置的界面锣吼。

    從這個(gè)比對(duì)結(jié)果來(lái)看选浑,差異是非常之大,由于序列較少玄叠,繼續(xù)建樹應(yīng)該影響不大古徒。但我們還是單獨(dú)看一下擬南芥和馬鈴薯各自的比對(duì)結(jié)果。

    擬南芥

    馬鈴薯

    可以看出诸典,這樣的結(jié)果使我們不想要的描函,但是由于序列較少,基本不影響建樹的準(zhǔn)確性狐粱。但是為了進(jìn)一步。我們需要進(jìn)行修剪多序列比對(duì)結(jié)果胆数,以構(gòu)建更準(zhǔn)確的進(jìn)化樹肌蜻。

    先講MEGA多序列比對(duì)結(jié)果導(dǎo)出為fasta格式。然后打開tbtools必尼,使用Trimmer快速修剪蒋搜。

    修建之后篡撵,就美好了很多,如下:

    2.3?進(jìn)化樹構(gòu)建

    這里選擇NJ模型進(jìn)行建樹豆挽。如下:

    在保存的時(shí)候就出現(xiàn)一些bug育谬,總體來(lái)說(shuō)還是不習(xí)慣用MEGA來(lái)編輯和美化進(jìn)化樹。

    因此在這里將樹文件導(dǎo)出

    導(dǎo)出后生成以.nwk結(jié)尾的樹文件帮哈,這個(gè)文件可以用其他進(jìn)化樹美化軟件打開后進(jìn)行操作膛檀。

    二、進(jìn)化樹的編輯與美化

    用過(guò)兩款在線軟件娘侍,一是Evolview咖刃,二是iTOL。兩款都是在線軟件憾筏,最開始用Evolview嚎杨,很容易上手操作,但是個(gè)人感覺軟件功能較為單一氧腰,適合初學(xué)者進(jìn)行操作枫浙,后來(lái)就放棄使用了。iTOL就比較強(qiáng)大了古拴,建議注冊(cè)賬號(hào)自脯,這樣可以保留編輯記錄,以便后期查看斤富,這款軟件的強(qiáng)大之處在于可以配置各種自己所需的配置文件膏潮,使進(jìn)化樹更具個(gè)性。網(wǎng)址貼在這里满力,感興趣的自行探索焕参,下面使用iTOL進(jìn)行簡(jiǎn)單編輯。

    Evolview:https://www.evolgenius.info/evolview/#login

    iTOL:https://itol.embl.de/itol.cgi

    好了油额,打開iTOL叠纷,界面如下:

    可以看到右邊操作面板很人性化,可以通過(guò)點(diǎn)擊不同的選項(xiàng)進(jìn)行美化和編輯潦嘶。

    先來(lái)上傳剛才生成的樹文件涩嚣。

    這個(gè)無(wú)根樹,hhh……掂僵,看起來(lái)怎么有點(diǎn)像一只小動(dòng)物航厚,interesting!

    由于這個(gè)例子只是做一示范锰蓬,并不想花很多精力去準(zhǔn)備配置文件做更為詳細(xì)的美化和編輯幔睬。

    授人以魚不如授人以漁,這里直接推進(jìn)iTOL官網(wǎng)的help說(shuō)明文檔芹扭,https://itol.embl.de/help.cgi

    配置文件不難準(zhǔn)備麻顶,根據(jù)個(gè)人需要準(zhǔn)備即可赦抖。尤其在顏色配置過(guò)程中還是蠻考驗(yàn)審美水平的,如果對(duì)顏色沒有超高理解的話還是盡量選擇高水平文章中的色彩搭配進(jìn)行練習(xí)并使用辅肾。

    先寫到這里队萤。

    ?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
    • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市矫钓,隨后出現(xiàn)的幾起案子要尔,更是在濱河造成了極大的恐慌,老刑警劉巖份汗,帶你破解...
      沈念sama閱讀 206,013評(píng)論 6 481
    • 序言:濱河連續(xù)發(fā)生了三起死亡事件盈电,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡杯活,警方通過(guò)查閱死者的電腦和手機(jī)匆帚,發(fā)現(xiàn)死者居然都...
      沈念sama閱讀 88,205評(píng)論 2 382
    • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)旁钧,“玉大人吸重,你說(shuō)我怎么就攤上這事⊥峤瘢” “怎么了嚎幸?”我有些...
      開封第一講書人閱讀 152,370評(píng)論 0 342
    • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)寄猩。 經(jīng)常有香客問(wèn)我嫉晶,道長(zhǎng),這世上最難降的妖魔是什么田篇? 我笑而不...
      開封第一講書人閱讀 55,168評(píng)論 1 278
    • 正文 為了忘掉前任替废,我火速辦了婚禮,結(jié)果婚禮上泊柬,老公的妹妹穿的比我還像新娘椎镣。我一直安慰自己,他們只是感情好兽赁,可當(dāng)我...
      茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
    • 文/花漫 我一把揭開白布状答。 她就那樣靜靜地躺著,像睡著了一般刀崖。 火紅的嫁衣襯著肌膚如雪惊科。 梳的紋絲不亂的頭發(fā)上,一...
      開封第一講書人閱讀 48,954評(píng)論 1 283
    • 那天蒲跨,我揣著相機(jī)與錄音译断,去河邊找鬼。 笑死或悲,一個(gè)胖子當(dāng)著我的面吹牛孙咪,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播巡语,決...
      沈念sama閱讀 38,271評(píng)論 3 399
    • 文/蒼蘭香墨 我猛地睜開眼翎蹈,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了男公?” 一聲冷哼從身側(cè)響起荤堪,我...
      開封第一講書人閱讀 36,916評(píng)論 0 259
    • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎枢赔,沒想到半個(gè)月后澄阳,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
      沈念sama閱讀 43,382評(píng)論 1 300
    • 正文 獨(dú)居荒郊野嶺守林人離奇死亡踏拜,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
      茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
    • 正文 我和宋清朗相戀三年碎赢,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片速梗。...
      茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
    • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡肮塞,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出姻锁,到底是詐尸還是另有隱情枕赵,我是刑警寧澤,帶...
      沈念sama閱讀 33,624評(píng)論 4 322
    • 正文 年R本政府宣布位隶,位于F島的核電站拷窜,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏涧黄。R本人自食惡果不足惜篮昧,卻給世界環(huán)境...
      茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
    • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望弓熏。 院中可真熱鬧恋谭,春花似錦、人聲如沸挽鞠。這莊子的主人今日做“春日...
      開封第一講書人閱讀 30,199評(píng)論 0 19
    • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)信认。三九已至材义,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間嫁赏,已是汗流浹背其掂。 一陣腳步聲響...
      開封第一講書人閱讀 31,418評(píng)論 1 260
    • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留潦蝇,地道東北人款熬。 一個(gè)月前我還...
      沈念sama閱讀 45,401評(píng)論 2 352
    • 正文 我出身青樓深寥,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親贤牛。 傳聞我的和親對(duì)象是個(gè)殘疾皇子惋鹅,可洞房花燭夜當(dāng)晚...
      茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

    推薦閱讀更多精彩內(nèi)容