如何輕松構(gòu)建物種系統(tǒng)發(fā)育樹

在常規(guī)的基因組分析中，當(dāng)我們對某一物種的基因組進行從頭組裝與注釋獲得其的基本信息后恳啥，通常會想知道該物種與一些其他近源物種之間的進化關(guān)系毛萌，此時就需要構(gòu)建不同物種之間的系統(tǒng)發(fā)育樹以探究該物種的進化地位肖抱。

我們這里將以不同物種之間保守的單拷貝核基因為基礎(chǔ)灸促，分別運用串聯(lián)法(Concatenation)（先將不同物種之間的每個單拷貝基因單獨進行多序列比對，然后將這些比對后的單拷貝基因進行首尾相連串接成一個supergene矩陣升薯，最后將這個supergene用于構(gòu)建系統(tǒng)發(fā)育樹）和并聯(lián)法(Coalescence)（先將不同物種之間的每個單拷貝基因單獨進行多序列比對莱褒，并構(gòu)建每一個單拷貝基因?qū)?yīng)的基因樹，然后將所有單拷貝基因?qū)?yīng)的基因樹進行合并重構(gòu)出相應(yīng)的物種樹）進行ML系統(tǒng)發(fā)育樹的構(gòu)建涎劈。

準(zhǔn)備文件：不同物種的蛋白序列文件: AT.fas  Bradi.fas  LOC_Os.fas  Potri.fas scaffold.fas  VIT.fas
所需軟件：OrthoFinder, Mafft, TrimAI, RAxML, ASTRAL
所用腳本：EasySpeciesTree.py

1.使用OrthoFinder尋找不同物種之間的單拷貝基因

下載OrthoFinder程序包解壓后即可使用（該軟件需要依賴blast橡类，mcl猖闪，fastme党觅，fasttree等程序萝玷，需要提前安裝好并添加到環(huán)境變量中，詳細(xì)信息可查看軟件的README文件）
查看軟件幫助信息：./orthofinder -h

1.png

新建一個文件夾test蹦浦，將所用物種的蛋白序列放入到該文件夾中
軟件使用：./orthofinder -f test/ -S diamond
-f參數(shù)指定所用文件夾扭吁，默認(rèn)使用blastp進行蛋白序列的比對，可加-S參數(shù)指定使用diamond程序進行比對（diamond需提前安裝并添加到環(huán)境變量中盲镶，比對速度比blast快很多）
程序運行結(jié)束后會在test文件夾中生成一個Results文件侥袜，里面即為不同物種之間的Orthogroups和單拷貝基因等相關(guān)信息。

2.png

我們所需的單拷貝基因和對應(yīng)的每個Orthogroups的具體信息在SingleCopyOrthogroups.txt和Orthogroups.csv文件中溉贿。

3.png

2.使用EasySpeciesTree腳本進行物種系統(tǒng)發(fā)育樹的構(gòu)建

該腳本依賴Mafft, TrimAI, RAxML和ASTRAL程序枫吧，需要自己提前安裝好
修改腳本中相應(yīng)依賴程序的絕對路徑：vim EasySpeciesTree.py

4.png

查看腳本幫助信息：python EasySpeciesTree.py -h
或添加腳本執(zhí)行權(quán)限（chmod +x EasySpeciesTree.py)后運行./EasySpeciesTree.py -h

5.png

運行該腳本需要提供四個文件：所用物種基因名的縮寫前綴文件，單拷貝基因文件SingleCopyOrthogroups.txt宇色，所有物種的Orthogroups文件Orthogroups.csv九杂，以及所有物種的蛋白序列合并后的文件all-pep.fas
合并所有物種的蛋白序列文件：for i in ls *.fas;do cat $i >>all-pep.fas;done
新建所有物種基因名的縮寫前綴文件：vim species_id.txt

6.png

運行腳本構(gòu)建物種系統(tǒng)發(fā)育樹：nohup ~/EasySpeciesTree.py -in1 species_id.txt -in2 SingleCopyOrthogroups.txt -in3 Orthogroups.csv -in4 all-pep.fas -nb 10 -t 16 &
這里為了演示快速生成結(jié)果加上-nb參數(shù)設(shè)定bootstrap值為10，-t參數(shù)設(shè)定線程數(shù)為16宣蠕，默認(rèn)bootstrap值為100例隆，thread值為10，氨基酸替換模型選擇默認(rèn)的PROTGAMMAJTT模型植影。
程序運行結(jié)束后會在當(dāng)前路徑下生成四個文件夾：SingleGene裳擎，SingleGene_MSA涎永，Concatenation思币，Coalescence鹿响，分別存放著所有單拷貝基因的序列，單拷貝基因比對后的序列谷饿，串聯(lián)法建樹的結(jié)果惶我，并聯(lián)法建樹的結(jié)果。
詳細(xì)運行過程可查看nohup.out文件中的日志信息博投。

7.png

Concatenataion文件夾中的RAxML_bipartitions.concatenation_out.nwk即為串聯(lián)法最終生成的樹文件

8.png

Coalescence文件夾中的Astral.coalescence_tree.nwk即為并聯(lián)法最終生成的樹文件

9.png

3.使用FigTree或MEGA進行可視化

將串聯(lián)法和并聯(lián)法生成的結(jié)果文件RAxML_bipartitions.concatenation_out.nwk绸贡，Astral.coalescence_tree.nwk導(dǎo)入FigTree中進行可視化

串聯(lián)法FigTree可視化結(jié)果

10.png

并聯(lián)法FigTree可視化結(jié)果

11.png

EasySpeciesTree程序下載鏈接：https://github.com/dongwei1220/EasySpeciesTree.git
可用git clone https://github.com/dongwei1220/EasySpeciesTree.git 直接下載使用。

12.png

最后編輯于：2020.05.01 10:50:36

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末毅哗，一起剝皮案震驚了整個濱河市听怕，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌虑绵，老刑警劉巖尿瞭，帶你破解...
沈念sama閱讀 221,635評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異翅睛，居然都是意外死亡声搁，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,543評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門捕发，熙熙樓的掌柜王于貴愁眉苦臉地迎上來疏旨，“玉大人，你說我怎么就攤上這事扎酷￠芾裕” “怎么了？”我有些...
開封第一講書人閱讀 168,083評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵霞玄，是天一觀的道長骤铃。經(jīng)常有香客問我，道長坷剧，這世上最難降的妖魔是什么惰爬？我笑而不...
開封第一講書人閱讀 59,640評論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮惫企，結(jié)果婚禮上撕瞧，老公的妹妹穿的比我還像新娘。我一直安慰自己狞尔，他們只是感情好丛版，可當(dāng)我...
茶點故事閱讀 68,640評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著偏序，像睡著了一般页畦。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上研儒，一...
開封第一講書人閱讀 52,262評論 1贊 308
城市分裂傳說
那天豫缨，我揣著相機與錄音独令，去河邊找鬼。笑死好芭，一個胖子當(dāng)著我的面吹牛燃箭，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播舍败，決...
沈念sama閱讀 40,833評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼招狸，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了邻薯？” 一聲冷哼從身側(cè)響起裙戏，我...
開封第一講書人閱讀 39,736評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎厕诡，沒想到半個月后挽懦，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,280評論 1贊 319
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡木人，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,369評論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年信柿，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片醒第。...
茶點故事閱讀 40,503評論 1贊 352
活死人
序言：一個原本活蹦亂跳的男人離奇死亡渔嚷，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出稠曼，到底是詐尸還是另有隱情形病，我是刑警寧澤，帶...
沈念sama閱讀 36,185評論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布霞幅，位于F島的核電站漠吻，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏司恳。R本人自食惡果不足惜途乃，卻給世界環(huán)境...
茶點故事閱讀 41,870評論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望扔傅。院中可真熱鬧耍共，春花似錦、人聲如沸猎塞。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,340評論 0贊 24
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽荠耽。三九已至钩骇，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背倘屹。一陣腳步聲響...
開封第一講書人閱讀 33,460評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工韩容，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人唐瀑。一個月前我還...
沈念sama閱讀 48,909評論 3贊 376
代替公主和親
正文我出身青樓，卻偏偏與公主長得像插爹，于是被迫代替她去往敵國和親哄辣。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,512評論 2贊 359

如何輕松構(gòu)建物種系統(tǒng)發(fā)育樹

1.使用OrthoFinder尋找不同物種之間的單拷貝基因

2.使用EasySpeciesTree腳本進行物種系統(tǒng)發(fā)育樹的構(gòu)建

3.使用FigTree或MEGA進行可視化

推薦閱讀更多精彩內(nèi)容