一鹅很、研究背景
異源四倍體芥菜(AABB)屬于十字花科蕓薹屬,是重要經(jīng)濟作物峻黍,主要包括菜用和油用芥菜兩大類群,種植范圍較廣拨匆,經(jīng)濟價值較大姆涩。菜用芥菜主要分布在中國等東亞國家和地區(qū),油用芥菜主要分布在印度等南亞國家和地區(qū)惭每。芥菜是"禹氏三角"中重要的一員骨饿,由白菜和黑芥雜交后加倍而來,至少發(fā)生了三次古多倍化事件台腥,因此非常具有研究價值宏赘。但是由于其為異源多倍體,相關(guān)的全基因組測序工作一直很難開展览爵。來自浙江大學置鼻、北京百邁客等單位的團隊共同合作,利用最新的測序技術(shù)(PacBio+BioNano)蜓竹,成功的組裝出高質(zhì)量的芥菜基因組圖譜箕母,為進一步改良芥菜的農(nóng)藝性狀提供了基礎(chǔ)储藐,為多倍體物種遺傳育種提供了新的方向。同時嘶是,也從多角度論證了芥菜A亞基因組起源問題钙勃,揭示了多倍體亞基因組間同源基因表達與選擇機制。
二聂喇、研究方法
1辖源、組裝
基于文章設計,我們選取菜用芥菜的一個變種(榨菜)希太,使用二代測序和三代測序相結(jié)合的方法進行初步組裝克饶,然后利用光學圖譜進行校正,得到了一版高質(zhì)量的芥菜基因組誊辉,其中contig N50 由 28Kb 提升到61Kb 矾湃,scaffold N50 由710k 提升到1.5Mb.基因組完整性達到85%。另外我們還利用二代測序技術(shù)組裝了一版黑芥的基因組堕澄,基因組大小為591Mb邀跃,完整度為68%。
然后利用遺傳圖和光學圖譜對A蛙紫、B亞基因組進行區(qū)分,整體掛載效果非常好拍屑,A為91.48%,B為72.32%坑傅。利用光學圖譜和遺傳圖譜對基因組進行區(qū)分僵驰,為其他多倍體物種基因組研究提供了參考。
2裁蚁、基因組注釋情況
在高質(zhì)量的基因組的情況下矢渊,我們采用從頭+同源+轉(zhuǎn)錄組結(jié)合的方法在芥菜基因組中獲得了 80050 個編碼蛋白的基因,其中有97.8%的基因可以注釋到Nr庫枉证。另外黑芥基因組預測出來49826個編碼蛋白的基因,其中94.7%可以注釋到Nr移必。重復序列部分芥菜A基因組中重復序列比例為44.25%室谚,B為52.37%。
三崔泵、研究結(jié)果
1秒赤、芥菜A亞基因組起源問題
芥菜的基因組是異源四倍體(AABB),在"禹氏三角"中由白菜(AA)憎瘸,黑芥(BB)雜交后加倍形成入篮,在演化過程中變異類型非常豐富。問題是油用芥菜的AA和菜用芥菜的AA是來自同一個亞種幌甘,還是來自多個亞種呢潮售,這個問題就是A亞基因組的起源問題痊项。
- a圖,對芥菜A酥诽、白菜A鞍泉、甘藍型油菜A進行共線性分析,可以發(fā)現(xiàn)其是高度共線的肮帐。
- b圖. 我們對10個菜用的芥菜咖驮、7個油用的芥菜,5個甘藍型油菜基因組训枢、27個白菜基因組(多亞種)進行了重測序分析托修,并繪制如上圖中的進化樹。從b圖中可以看到芥菜全部聚在一起恒界,沒有出現(xiàn)分散的情況诀黍,說明芥菜中A的基因組是來源于同一個亞種,屬于單系起源仗处。
- c圖中對同源物種和芥菜進行了進化樹構(gòu)建眯勾,并計算了芥菜分化的具體時間為3-5萬年。
除了從群體的角度研究了芥菜亞基因組A起源問題婆誓,還從PCA聚類和Fixed SNP角度驗正了單系起源的結(jié)論吃环。
2、基因表達的dominance現(xiàn)象
由于芥菜基因組是異源四倍體洋幻,也就是說基因組中存在兩套非常相似的亞基因組郁轻,那么在基因表達的過程中,位于兩套亞基因組上的等位基因的表達模式是怎么樣的呢文留,是一起表達好唯,是相互抑制,還是一方占主導燥翅?
通過計算等位基因的表達量骑篙,發(fā)現(xiàn)在不同的時期,不同組織之間森书,發(fā)現(xiàn)存在dominance基因靶端,存在dominance的基因經(jīng)受的選擇壓力大于Neutral基因(不存在dominance現(xiàn)象,功能非常重要凛膏,純化作用較強杨名,不輕易突變),但是小于Subordinate基因(作用不重要猖毫,純化作用較小台谍,易丟失)。
3吁断、油用芥菜和菜用芥菜的選擇與分化
通過菜用和油用芥菜群體進行選擇清除分析趁蕊,發(fā)現(xiàn)dominance的基因被篩選出來的比例較高坞生,同時結(jié)合轉(zhuǎn)錄組數(shù)據(jù),這部分基因在油用和菜用兩個群體中差異表達介衔。同時通過上面的分析發(fā)現(xiàn)與硫苷恨胚,脂類代謝顯著相關(guān)并且存在dominance的基因組,這些基因在油用菜用群體中有各自獨特基因分型炎咖。
四赃泡、文章亮點
多個角度證據(jù)解決芥菜亞基因組A亞基因組單系起源/雜交起源爭論:Asubgenome phylogenetic tree,PCA, polymprphism and fixed SNP乘盼;
通過構(gòu)建群體模型及貝葉斯方法評估多倍體芥菜形成時間上下限升熊,為新多倍體物種形成時間估算提供新方法;
從不同發(fā)育時期绸栅,不同組織级野,不同處理條件,不同進化時期多個角度系統(tǒng)分析異源多倍體dominance 現(xiàn)象粹胯;
通過油用菜用群體選擇角度識別vegetable- and oil- use B. juncea 分化選擇區(qū)域蓖柔,發(fā)現(xiàn)與硫苷,脂類代謝顯著相關(guān)并且存在dominance的基因組风纠,這些基因在油用菜用群體中有各自獨特基因分型况鸣;
首次找到 dominance gene 與潛在農(nóng)藝性狀選擇相關(guān)性的證據(jù),為多倍體物種遺傳育種提供了新的方向和基因候選材料竹观。
五镐捧、摘要
The Brassica genus encompasses three diploid and three allopolyploid genomes, but a clear understanding of the evolution of agriculturally important traits via polyploidy is lacking. We assembled an allopolyploid Brassica juncea genome by shotgun and single-molecule reads integrated to genomic and genetic maps. We discovered that the A subgenomes of B. juncea and Brassica napus each had independent origins. Results suggested that A subgenomes of B. juncea were of monophyletic origin and evolved into vegetable-use and oil-use subvarieties. Homoeolog expression dominance occurs between subgenomes of allopolyploid B. juncea, in which differentially expressed genes display more selection potential than neutral genes. Homoeolog expression dominance in B. juncea has facilitated selection of glucosinolate and lipid metabolism genes in subvarieties used as vegetables and for oil production. These homoeolog expression dominance relationships among Brassicaceae genomes have contributed to selection response, predicting the directional effects of selection in a polyploid crop genome.
六、參考文獻
The genome sequence of allopolyploid Brassica juncea and analysis of differential homoeolog gene expression influencing selection
http://www.biomarker.com.cn/archives/12484
https://med.sina.com/article_detail_103_1_10566.html
https://www.obiosh.com/keyanfuwu/zuxuefuwu/jiyinzuxue/115.html