蔥屬植物是一個(gè)大的單子葉植物類(lèi)別蔽挠,含近千個(gè)物種淆两,其中不少物種具有顯著的經(jīng)濟(jì)價(jià)值。大蒜是重要的蔥屬作物之一拂酣,我國(guó)大蒜的年播種面積達(dá)到1000萬(wàn)畝以上秋冰。**大蒜具有膨大的鱗莖,富含大蒜素婶熬,不僅可用作蔬菜和調(diào)味料食品剑勾,也被廣泛用于醫(yī)藥產(chǎn)業(yè)。大蒜基因組未知赵颅,且栽培種大蒜一般不育虽另,嚴(yán)重阻礙了大蒜生物學(xué)研究及大蒜育種工作。
大蒜屬于二倍體物種(2n=16)饺谬,但大蒜基因組非常大(16.9 Gb)捂刺,且具有重復(fù)率高(預(yù)估> 80%),雜合度大(~1.68%)等特點(diǎn)募寨,屬于非常復(fù)雜的基因組為了解碼大蒜基因組族展,中國(guó)農(nóng)業(yè)科學(xué)院麻類(lèi)研究所劉頭明研究團(tuán)隊(duì),聯(lián)合山東農(nóng)業(yè)大學(xué)拔鹰,西北農(nóng)林科技大學(xué)仪缸,武漢大學(xué)和諾禾致源生物科技公司,歷時(shí)四年完成了大蒜基因組的測(cè)序和組裝工作列肢,研究結(jié)果以“A chromosome-level genome assembly of garlic (Allium sativum L.) provides insights into genome evolution and allicin biosynthesis”為題恰画,在線發(fā)表在Molecular Plant(影響因子 12.084)上。
該研究綜合利用PacBio瓷马,Nanopore拴还,Illumina PE,10X Genomics和Hi-C技術(shù)開(kāi)展了大蒜的基因組測(cè)序欧聘,測(cè)序數(shù)據(jù)量達(dá)到4.3 Tb自沧。
經(jīng)過(guò)組裝后得到的基因組大小為16.24 Gb, Contig 和superscaffold N50分別為194 kb和1.69 Gb。單條染色體最小的為1.35 Gb树瞭,最大的達(dá)到2.16 Gb拇厢。注釋分析發(fā)現(xiàn)大蒜基因組中含57561個(gè)基因,BUSCO和CEGMA評(píng)估證明大蒜基因組組裝質(zhì)量較好晒喷。作者還通過(guò)大規(guī)模的轉(zhuǎn)錄組數(shù)據(jù)來(lái)表征了大蒜不同組織以及膨大鱗莖不同發(fā)育時(shí)期的基因表達(dá)模式孝偎。大規(guī)模轉(zhuǎn)錄組分析共鑒定到847個(gè)鱗莖中特異表達(dá)的大蒜基因,5881個(gè)鱗莖膨大期間差異表達(dá)基因凉敲;另外衣盾,在102個(gè)大蒜品種中寺旺,完成大蒜鱗莖的基因表達(dá)與鱗莖重量性狀的皮爾森相關(guān)性分析。結(jié)合這些基因表達(dá)結(jié)果發(fā)現(xiàn)多個(gè)WOX家族基因和生長(zhǎng)素相關(guān)基因可能參與到鱗莖發(fā)育势决。
大蒜基因組作為首個(gè)蔥屬物種中完成測(cè)序的基因組阻塑,對(duì)于研究物種進(jìn)化具有重要的意義。研究團(tuán)隊(duì)基于基因組系統(tǒng)進(jìn)化分析發(fā)現(xiàn)大蒜與天門(mén)冬科蘆筍在大約80.8百萬(wàn)年前發(fā)生了分化果复。大蒜在進(jìn)化過(guò)程中發(fā)生了三次全基因組復(fù)制(WGD)事件陈莽,其中兩次發(fā)生在與蘆筍分化之前,另有一次近期的WGD事件發(fā)生在17.9 MYA虽抄。此外走搁,大蒜基因組在~20-30萬(wàn)年前轉(zhuǎn)座元件發(fā)生急劇擴(kuò)張(另外,這次轉(zhuǎn)座元件的爆發(fā)也解釋了與大蒜素和菊粉類(lèi)新型果聚糖生物合成相關(guān)基因的演化迈窟,為這兩個(gè)化合物的生物合成提供了新的視野私植。),導(dǎo)致基因組中高達(dá)91.3%的序列為重復(fù)序列车酣,這是迄今為止所發(fā)現(xiàn)的重復(fù)序列比例最高的基因組曲稼。因此,該研究推斷大蒜的三次全基因組復(fù)制事件及重復(fù)序列急劇擴(kuò)張是驅(qū)動(dòng)大蒜基因組龐大的根本原因湖员。
最后躯肌,本研究通過(guò)基因組擴(kuò)張收縮分析,發(fā)現(xiàn)菊糖型果聚糖合成關(guān)鍵酶6G-FFT基因和蒜氨酸酶基因發(fā)生了急劇擴(kuò)張破衔,推測(cè)它們可能分別與大蒜特有化合物菊糖型果聚糖和大蒜素的生物合成進(jìn)化相關(guān)清女。結(jié)合轉(zhuǎn)錄組數(shù)據(jù),該研究確立了大蒜素生物合成通路晰筛,發(fā)現(xiàn)4個(gè)串聯(lián)重復(fù)的蒜氨酸酶基因隨著大蒜鱗莖發(fā)育嫡丙,其表達(dá)量持續(xù)上升,推測(cè)它們與大蒜鱗莖中的蒜氨酸酶積累相關(guān)读第。
據(jù)悉,此次完成測(cè)序的品種為二水早紫皮蒜怜瞒,也就是俗稱的四川蒜父泳。劉頭明解釋稱,之所以將二水早紫皮蒜選為首個(gè)測(cè)序的品種吴汪,是因?yàn)樗m用性廣惠窄,在我國(guó)種植地域也最廣。山東農(nóng)業(yè)大學(xué)孫秀東副教授漾橙,李寧陽(yáng)副教授和喬旭光教授杆融,中國(guó)農(nóng)業(yè)科學(xué)院麻類(lèi)研究所朱四元研究員,程毅副研究員霜运,諾禾致源生物公司趙靜博士為本文第一作者脾歇,中國(guó)農(nóng)業(yè)科學(xué)院麻類(lèi)研究所劉頭明研究員蒋腮,粟建光研究員,西北農(nóng)林科技大學(xué)程智慧教授為論文通訊作者藕各。本研究受到了國(guó)家重點(diǎn)研發(fā)項(xiàng)目池摧,中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)科技創(chuàng)新工程和國(guó)家自然科學(xué)基金項(xiàng)目資助。
Analysis of LTR Retrotransposons
Full-length LTR retrotransposons were identified in the garlic and Asparagus officinalis genomes using LTR_FINDER (Xu and Wang, 2007) and LTRharvest (Ellinghaus et al., 2008) with default parameters. Candidate LTR sequences were filtered as described by Hu et al. (2011). Briefly, only sequences containing intact LTR domains that belonged to families with more than two members were retained. Full-length LTRs were subsequently translated into amino acids in three frames. Translated sequences were mapped against the Ty1_Copia (PF07727) and Ty3_Gypsy(PF000078) domains in the Pfam database using HMMER (http://hmmer.org) with E-values % 1e5.
Sequences that mapped to the Copia and Gypsy superfamilies were aligned using MAFFT(https://mafft.cbrc.jp/alignment/software/) with default parameters. The phylogenetic trees of LTR-RTs in the two superfamilies were constructed using FastTree (http://www.microbesonline.org/fasttree/).
論文鏈接:https://www.cell.com/molecular-plant/fulltext/S1674-2052(20)30232-X
參考:http://www.360doc.com/content/20/0731/06/57935769_927740040.shtml