本文具體介紹生物信息學(xué)分析中最常用的群體結(jié)構(gòu)展示圖形——系統(tǒng)發(fā)育樹鳖眼,分為兩部分進(jìn)行說明:系統(tǒng)發(fā)育樹的基本概念和系統(tǒng)發(fā)育樹的構(gòu)建。
全文重點(diǎn):
第一部分
系統(tǒng)發(fā)育樹是描述物種間進(jìn)化關(guān)系的一種圖形钦讳,樹的結(jié)果是通過算法推測的,并不一定是絕對真實(shí)的情況缚去。
系統(tǒng)發(fā)育樹中的分支反映了物種是如何從一系列共同祖先進(jìn)化而來的琼开。
在系統(tǒng)發(fā)育樹中易结,如果兩個(gè)物種的共同祖先較近柜候,則它們之間的相關(guān)性高;如果它們的共同祖先較遠(yuǎn)鹦肿,則兩個(gè)物種的相關(guān)性小辅柴。
系統(tǒng)發(fā)育樹有很多種形式。各分支繞節(jié)點(diǎn)旋轉(zhuǎn)所傳達(dá)的信息不會改變碌嘀。
第二部分
如何構(gòu)建一棵發(fā)表級系統(tǒng)發(fā)育樹?
我的生產(chǎn)力工具开泽。
基本概念:
系統(tǒng)發(fā)育樹(英文:Phylogenetic tree)又稱為進(jìn)化樹(Evolutionary tree)魁瞪,是表明被認(rèn)為具有共同祖先的各物種間進(jìn)化關(guān)系的樹惠呼。是一種親緣分支分類方法(Cladogram)峦耘。在樹中,每個(gè)節(jié)點(diǎn)代表其各分支的最近共同祖先辅髓,而節(jié)點(diǎn)間的線段長度對應(yīng)演化距離(如估計(jì)的演化時(shí)間)。
進(jìn)化關(guān)系——祖先矫付?
當(dāng)我們繪制系統(tǒng)發(fā)育樹時(shí)第焰,我們預(yù)設(shè)了一個(gè)關(guān)于一組物種(或其他群體)如何從共同祖先進(jìn)化而來的最佳假設(shè)。 這種假設(shè)是基于我們已經(jīng)收集到的挺举,有關(guān)一組物種的信息,如物理特征脂崔、DNA序列和蛋白序列之類的信息梧喷。
在系統(tǒng)發(fā)育樹中砌左,用于研究的物種或者是其他群體都位于進(jìn)化枝的末端伤柄,如下圖所示文搂,A、B笔喉、C、D和E為五個(gè)物種常挚,都放在了各分支的末端。
系統(tǒng)發(fā)育樹分支連接的模式奄毡,代表我們對樹中物種如何從一系列共同祖先進(jìn)化而來的理解贝或。 每個(gè)分支點(diǎn)(也稱為內(nèi)部節(jié)點(diǎn))表示發(fā)散事件锐秦,也可以理解成將某個(gè)組拆分為兩個(gè)后代組盗忱。簡單說就是,每個(gè)分支點(diǎn)之上的部分都是在從該分支點(diǎn)下所有物種的最近共同祖先扇谣。 例如闲昭,在產(chǎn)生物種A和B的分支點(diǎn)上,我們可以找到這兩個(gè)物種的最新共同祖先序矩。 在樹根上方的分支點(diǎn),我們可以找到樹中所有物種的共同祖先(物種A楞慈,B,C囊蓝,D和E)令蛉。
進(jìn)化關(guān)系——物種之間的關(guān)系
在系統(tǒng)樹中,兩個(gè)物種的相關(guān)性具有非常特殊的含義蝎宇。 我們先用一種非常簡單的方法來找到一組物種的最近共同祖先祷安。 在這種方法中,我們從兩個(gè)感興趣的物種的枝末端開始汇鞭,然后向后走,直到找到物種線會聚的點(diǎn)台囱,所走過的距離可以看成兩個(gè)物種共同祖先的出現(xiàn)時(shí)間读整,距離越短,共同祖先出現(xiàn)的時(shí)間越近,反之亦然豺总。
知道了這個(gè)關(guān)鍵法則择懂,我們就可以看出兩個(gè)物種之間的相關(guān)性喻喳。如果兩個(gè)物種的共同祖先較近困曙,則它們的關(guān)聯(lián)性高;如果它們的共同祖先較遠(yuǎn)蹦哼,則兩個(gè)物種的關(guān)聯(lián)性較小要糊。例如,從圖上看锄俄,我們可以說A和B的關(guān)系比B和C的關(guān)系更緊密。但是鱼填!我們不能判斷A和B是否比C和D更緊密相關(guān)毅戈。這是因?yàn)槟J(rèn)情況下,樹的水平軸并不直接表示時(shí)間苇经。 因此,我們只能比較發(fā)生在同一譜系(與樹根相同方向的直線)上分支事件的發(fā)生時(shí)間扇单,而不能比較發(fā)生在不同譜系上分支事件的發(fā)生時(shí)間。
我們該怎么看呢阻桅?
我們可能會看到以多種不同形式繪制的系統(tǒng)發(fā)育樹兼都,如下圖所示:
但是扮碧,萬變不離其中,上面的三棵樹代表物種A慎王,B,C蜀漆,D和E之間的相同關(guān)系是完全相同的咱旱。這些看起來不同的樹卻傳遞相同的信息确丢,提醒我們吐限,在典型的進(jìn)化樹中有更意義的是分支模式。
進(jìn)化樹的另一個(gè)關(guān)鍵是描函,如果使用任意分支點(diǎn)作為軸旋轉(zhuǎn)樹結(jié)構(gòu)狐粱,不會改變物種間的關(guān)系,如下圖所示:
另外基公,進(jìn)化樹的分支不僅有另個(gè)物種并列的形式宋欺,還有三個(gè)或者更多物種并列的形式(Polytomy),其原因是軟件沒有足夠的信息去確定他們的分支關(guān)系齿诞,如下圖所示。