Gene duplication and evolution in recurring polyploidization–diploidization cycles in plants
使用 dupGen_finder 識(shí)別不同的基因重復(fù)模式押框。
- 首先奋隶,使用蛋白質(zhì)序列( E < 1e-10孟辑,前5個(gè)匹配和 m8格式輸出) 進(jìn)行全對(duì)全局的局部 BLASTP 以搜索每個(gè)基因組內(nèi)所有潛在的同源基因?qū)Α?/li>
- 使用 MCScanX 算法來(lái)鑒定 WGD 衍生的基因?qū)Α?/li>
- 將這些 WGD 對(duì)從整個(gè)同源對(duì)(或 BLASTP 命中)中排除桑寨,以進(jìn)一步確定單基因復(fù)制。
- 如果 BLASTP 中的兩個(gè)基因在同一染色體上相鄰驳糯,它們就被定義為串聯(lián)基因?qū)Α?/li>
- 近端基因?qū)Ρ欢x為在同一染色體上由10個(gè)或更少的基因分離的非串聯(lián)對(duì)吼鳞。
- 為了鑒定轉(zhuǎn)座重復(fù),從整套同源基因?qū)χ型茖?dǎo)出 WGD蔼两、串聯(lián)基因和近端基因?qū)λ^D(zhuǎn)座重復(fù)對(duì)需要滿足以下標(biāo)準(zhǔn): 一個(gè)基因存在于其祖先基因座(命名為親本拷貝) ,另一個(gè)位于非祖先基因座(轉(zhuǎn)座拷貝)额划。兩類基因可視為祖先位點(diǎn): (i)種內(nèi)共線基因和(ii)種間共線基因妙啃。種內(nèi)共線性基因可以從 WGD 衍生的基因?qū)χ蝎@得,這些基因?qū)σ呀?jīng)在上面被鑒定俊戳。通過(guò)基因組間同線性分析識(shí)別種間共線性基因揖赴,在目標(biāo)基因組和外群基因組之間的種間 BLASTP 文件上執(zhí)行 MCScanX。
- 比如:以 Nelumbo nucifera 和 Spirodela polyrhiza 為外群抑胎,分別對(duì)所有的雙子葉植物和單子葉植物進(jìn)行鑒別燥滑。以 Amborella trichopoda 為外群,尋找 Nelumbo nucifera 和 Spirodela polyrhiza 祖先的共線塊阿逃。位于這些保守的同線性區(qū)塊中的基因被認(rèn)為是祖先基因座铭拧。
- Chlorophytes (綠藻)、Bryophytes (苔蘚植物)恃锉、 Lycophytes (石松類植物) 和其他植物之間共線區(qū)塊的稀少阻礙了通過(guò)應(yīng)用種間共線分析來(lái)鑒定這些物種的祖先基因座搀菩。因此,我們構(gòu)建了這些具有較大進(jìn)化距離的物種的基因之間的直系同源關(guān)系破托,從而推導(dǎo)出保守的祖先基因肪跋。為了鑒定 p. patens (一種苔蘚植物)和 s. moellendorffii (一種石松)中的祖先基因座,我們使用 OrthoFinder 和全基因組蛋白質(zhì)序列來(lái)推斷這兩個(gè)物種和其他五個(gè)物種的正交群: P. abies 土砂,S. polyrhiza 州既,N. nucifera 谜洽,Amborella trichopoda 和 Arabidopsis thaliana ∫滋遥基于上述直系同源群褥琐,如果 P. patens 或 S. moellendorffii 中的一個(gè)基因在至少兩個(gè)其他譜系中具有直系同源對(duì),則認(rèn)為該基因是古代的晤郑,并且可能存在于陸生植物的共同祖先中敌呈。同樣,我們?cè)诎朔N綠藻中建立了正交群造寝,以確定每種綠藻基因組內(nèi)的祖先位點(diǎn)磕洪。在以上步驟的基礎(chǔ)上,BLASTP 命中一個(gè)祖先位點(diǎn)和一個(gè)新的位點(diǎn)被定義為轉(zhuǎn)座重復(fù)诫龙。
- 最后析显,從整套同源基因?qū)χ腥コ?WGD、串聯(lián)签赃、近端和轉(zhuǎn)座重復(fù)后谷异,剩余的基因?qū)Ρ粴w類為散在重復(fù)。注意到同一個(gè)散在的基因可能有幾個(gè) BLASTP 命中導(dǎo)致一個(gè)基因的多個(gè)基因?qū)趿模覀冎豢紤]在這種情況下具有最高相似性的散在的基因?qū)Α?/li>
WGD >> TD >> PD >> TRD >> DSD
WGD:全基因組復(fù)制
TD:串聯(lián)重復(fù)(相鄰的兩個(gè)重復(fù)基因)
PD:近端重復(fù)(相隔10個(gè)以內(nèi)基因的重復(fù)基因)
TRD:轉(zhuǎn)置重復(fù)(祖先和新基因座組成的重復(fù)基因)
DSD:分散重復(fù)(不相鄰也不共線性的重復(fù)基因)
SL:?jiǎn)慰截?/p>