Sun X, Jiao C, Schwaninger H, et al. Phased diploid genome assemblies and pan-genomes provide insights into the genetic history of apple domestication. Nature Genetics, 2020, DOI: 10.1038/s41588-020-00723-9.
科學網(wǎng)—重磅推薦!康奈爾大學費章君團隊揭示蘋果馴化的遺傳學歷史 - 小柯生命的博文
分相的二倍體基因組組裝和泛基因組提供了對蘋果馴化遺傳史的見解
摘要
蘋果的馴化主要是由種間雜交驅(qū)動的。本研究報告了栽培的蘋果(Malus domestica cv. Gala)和其兩個主要野生祖先,M. sieversii和M. sylvestris的單倍型解析基因組橡疼。在每個基因組的兩個單倍型之間鑒定出實質(zhì)性的變異」歉澹基因組血統(tǒng)的推斷可確定約有23%的Gala基因組來自雜種翔曲。對91份蘋果種質(zhì)進行了深測序抖韩,確定了栽培蘋果的選擇性清除败玉,這些選擇性清除起源于兩個祖先中的任何一個敌土,并且與重要的馴化性狀有關。通過對蘋果pan基因組的構建和分析运翼,發(fā)現(xiàn)了數(shù)千個新基因返干,其中數(shù)百個是從其中一個祖先中篩選出來的,并且大部分固定在栽培蘋果中血淌,揭示了新基因/等位基因的導入是蘋果通過雜交馴化的一個標志矩欠。最后,Gala果實在13個發(fā)育階段的轉(zhuǎn)錄組圖譜揭示了19%的等位基因特異性表達悠夯,包括許多與果實品質(zhì)相關的基因癌淮。
正文
作物馴化對人類的人口增長和文明發(fā)展起著至關重要的作用。今天疗疟,人類嚴重依賴于數(shù)千年前被馴化的多種農(nóng)作物1该默。通過技術創(chuàng)新加強了關鍵作物的遺傳改良2瞳氓,3策彤,但由于馴化作物的遺傳多樣性狹窄而受到阻礙栓袖。作物野生近緣種是育種遺傳物質(zhì)的重要來源,而這些野生近緣種所需性狀的潛在基因常常被用來改良馴化種質(zhì)4店诗,5裹刮。盡管基因信息很重要,但用于作物野生親緣關系的基因組信息卻很少6庞瘸。
大多數(shù)作物基因組復雜捧弃,具有基因組大、雜合度高擦囊、多倍體等特點7违霞。這種復雜性對植物基因組組裝提出了挑戰(zhàn),為了獲得高質(zhì)量的基因組瞬场,通常需要在參考選擇上付出更多的努力买鸽,而且在許多情況下,低倍性的純合系更受青睞8,9贯被。然而眼五,許多植物在自然界中是自由授粉的,因此雜合基因組區(qū)域可能是表型變異的主要因素10彤灶。因此看幼,對自然雜合系的直接測序可以提供對其遺傳復雜性的深入見解11。另一方面幌陕,植物往往具有遺傳結構诵姜,單一的參考基因組決不能代表整個群體。因此搏熄,除了線性參考基因組外茅诱,還可以生成一個復雜的種群多樣性表示形式。這種表現(xiàn)形式的變體搬卒,包括基于基因的12,13或基于序列的14,15泛基因組瑟俭,成功地捕獲了隱藏的遺傳多樣性,并促進了重要性狀16,17的遺傳基礎的發(fā)現(xiàn)契邀。
蘋果(Malus domestica Borkh.)是一種廣受歡迎的溫帶水果摆寄,其馴化是通過不同野生種的雜交和優(yōu)良性狀基因型的克隆繁殖來實現(xiàn)的。在野生種中坯门,M. sieversii和M. sylvestris是主要的祖先18微饥,19,20古戴。蘋果基因組高度雜合欠橘,對早期的基因組組裝21,22提出了重大挑戰(zhàn)。目前现恼,栽培蘋果的參考質(zhì)量基因組組合可用于雙單倍體系GDDH13(參考文獻9)肃续、三單倍體HFTH1(參考文獻23)和二倍體品種“Gala Galaxy”24黍檩;對于其野生近緣物種,只有M. baccata的基因組草圖可用25始锚。在本研究中刽酱,我們組裝了栽培蘋果Gala的參考級、相性二倍體基因組瞧捌,這是一個生長在世界各地的頂級品種棵里,以及兩個主要的野生祖先M. sieversii和M. sylvestris。我們直接測序雜合系姐呐,揭示了基因組的二倍體狀態(tài)殿怜。我們還構建了基于91份深度重測序的蘋果屬植物的泛基因組。這些高質(zhì)量的參考基因組和泛基因組可以更好地了解蘋果馴化的遺傳基礎曙砂,為今后蘋果的研究和育種提供寶貴的資源稳捆。
結果
基因組組裝與同源染色體構建
我們?yōu)檫@3份種質(zhì)獲得了623-780倍的Illumina和10x基因組序列的覆蓋率,以及37-81倍的PacBio-HiFi序列覆蓋率(補充表1)麦轰。對于每份種質(zhì)乔夯,reads被組裝成一個包含定相scaffold的二倍體基因組,以及一個傳統(tǒng)的單倍體合并基因組(補充圖1)款侵。對于二倍體基因組末荐,最終組裝體的大小為1.31-1.32GB,對于單倍體合并基因組新锈,大小為652-668?Mb(補充表2)甲脏。盡管雜合度較高(0.85-1.28%),但所有的組裝都表現(xiàn)出很高的連續(xù)性妹笆,二倍體組合體的scaffold N50為3.3-4.3?Mb块请,單倍體合并基因組的scaffold N50為16.8-35.7?Mb(補充表2)。利用高密度的遺傳圖譜26,27和與已發(fā)表的基因組9拳缠,成功地錨定了96.7–97.8%的單倍體合并基因組scaffold墩新。
二倍體組裝的大小大約是單倍體基因組的兩倍,這表明同源染色體在每個組裝中都得到了很好的捕獲窟坐,這進一步得到了k-mer譜分析的支持(擴展數(shù)據(jù)圖1)海渊。大約93.7-95.5%的定相scaffold被分成兩個非冗余的集合(又稱為haplomes),它們被進一步錨定在17個同源染色體上哲鸳。每個haplome的累積大小為單倍體基因組的88.5–100.0%(補充表2)臣疑,所有三份材料都顯示出兩個haplome之間的高度共線性(圖1a)。使用多種方法的基因組評估證實了單倍體和二倍體組裝的高質(zhì)量(補充注釋和擴展數(shù)據(jù)圖2)徙菠。
圖1:Gala讯沈,M. sieversii和M. sylvestris的基因組和進化。
在二倍體組裝中婿奔,總共預測了90147-90507個蛋白質(zhì)編碼基因缺狠,在單倍體組裝中預測了45199-45352個蛋白質(zhì)編碼基因(補充表2)问慎。核苷酸結合、富含亮氨酸的重復基因廣泛參與抗病28儒老,并且在蘋果屬植物中發(fā)現(xiàn)高度可變(補充說明蝴乔、補充表3和補充圖2)记餐。
我們的組裝顯示出與已發(fā)表基因組的整體高共線性(補充圖3)驮樊,除了1號染色體上的5-Mb倒位,我們發(fā)現(xiàn)這可能是GDDH13和HFTH1基因組中的錯誤組裝(擴展數(shù)據(jù)圖3)片酝。我們鑒定了單倍體之間的實質(zhì)性差異囚衔,包括2387290、2591444和2929832個單核苷酸多態(tài)性(SNPs)雕沿、363464练湿、364605和401893個插入/缺失,以及M.sieversii审轮、M.sylvestris和Gala的202肥哎、343和330個倒位(補充表4和補充圖4)。
大約58.7–59.4%的蘋果基因組是重復序列疾渣,類似于GDDH13和HFTH1的基因組(補充表5和補充圖5)篡诽。我們發(fā)現(xiàn)在蘋果進化過程中發(fā)生了兩次長末端重復轉(zhuǎn)座子(LTR-RT)爆發(fā),其中較老的一次發(fā)生在蘋果和梨29的物種形成之前榴捡,最近的一次發(fā)生在M.sylvestris和M.sieversii分化為亞群之前(圖1b杈女、c和補充圖)。6和7)吊圾。LTR-RTs在重復爆發(fā)后的進化可能創(chuàng)造了物種間豐富的遺傳多樣性达椰。一個值得注意的例子是redTE逆轉(zhuǎn)錄轉(zhuǎn)座子,它在一些蘋果品種中轉(zhuǎn)移到MYB1基因座上项乒,導致了紅色果皮23啰劲。我們發(fā)現(xiàn)redTE只存在M.sieversii和M.domestica中,它以短雜合子的形式存在于Gala中檀何,可能導致MYB1等位基因的特異性表達呈枉,從而導致Gala的黃紅果皮顏色(補充注釋和擴展數(shù)據(jù)圖4)。