今天分享一篇來自nature communications的文章:The genetic basis of sex determination in grapes
Massonnet, M., Cochetel, N., Minio, A. et al. The genetic basis of sex determination in grapes. Nat Commun 11, 2902 (2020). https://doi.org/10.1038/s41467-020-16700-z
Abstract
對(duì)于植物性別分化基因及突變的鑒定至今仍然是一個(gè)重大挑戰(zhàn)遥皂。在此,本文研究了葡萄物種中性別決定區(qū)域(SDR)的結(jié)構(gòu)和演化聋溜。并報(bào)道了一個(gè)改進(jìn)的、染色體級(jí)別的赤霞珠(Cabernet Sauvignon)葡萄的基因組序列信息及逐步組裝了9個(gè)野生和栽培葡萄的基因組责静。通過解析20個(gè)葡萄品種的SDR單倍型徽缚,我們比較了雄性、雌性和雌雄同體的單倍型結(jié)構(gòu)驱富,并確定了性別決定相關(guān)區(qū)域锚赤。結(jié)合基因表達(dá)數(shù)據(jù),我們確定了VviINP1基因中的一個(gè)候選雄性不育突變褐鸥,以及與轉(zhuǎn)錄因子VviYABBY3相關(guān)的潛在雌性不育功能线脚。數(shù)據(jù)表明,在雌雄同體單倍型之間很少發(fā)生重組事件叫榕,導(dǎo)致雌雄異株在馴化過程中丟失浑侥。這項(xiàng)工作顯著地促進(jìn)了對(duì)葡萄性別決定遺傳基礎(chǔ)的理解,并提供了在葡萄育種計(jì)劃中快速鑒定性別類型所必需的信息晰绎。
Introduction
植物具有多種交配系統(tǒng)寓落。有些是雌雄同株異花的,在同一株植物上有單獨(dú)的雄花和雌花荞下;還有一些是雌雄同體的伶选,有兩性花。有時(shí)植物具有單獨(dú)的雄性和雌性個(gè)體尖昏,這種交配系統(tǒng)稱為雌雄異株仰税。雌雄異株需要保證異交,但這只發(fā)生在5-6%的被子植物中抽诉。盡管雌雄異株比較罕見陨簇,但它在系統(tǒng)發(fā)育上是廣泛存在的,表明它在多種情況下都是獨(dú)立進(jìn)化的迹淌。
由于雌雄異株的多種進(jìn)化起源和一些重要的經(jīng)濟(jì)作物具有雌雄異株的特性河绽,因此雌雄異株一直是眾多進(jìn)化和遺傳研究的焦點(diǎn)。關(guān)于雌雄異株起源的一個(gè)常見的假設(shè)是雙基因座模型巍沙,該模型要求雌雄異株從一個(gè)雌雄同體的祖先分兩步演化而來葵姥。第一步包括阻斷雄性性別決定功能的隱形突變。具有純合雄性不育突變的個(gè)體只保留雌性功能句携,而具有這種突變的種群中既有雌性也有雌雄同株的個(gè)體榔幸。第二步需要一個(gè)顯性突變來抑制雌性的功能,從而產(chǎn)生雄性。這種雙基因座系統(tǒng)只有在兩個(gè)基因座完全連鎖的情況下才能保持雌雄分離削咆,因?yàn)樗鼈冎g的重組可以恢復(fù)雌雄同體牍疏。對(duì)包括木瓜(Carica papaya)、草莓(Fragaria virginiana)拨齐、白花蠅子草(Silene latifolia)鳞陨、獼猴桃(Actinidia spp.)、葡萄(Vitis spp.)等物種的研究發(fā)現(xiàn)瞻惋,支持了這一雙基因座模型厦滤。然而,導(dǎo)致雌雄異株的不育突變尚未在任何物種中被完全鑒定出來歼狼。到目前為止掏导,對(duì)于不育突變基因最可能的候選來自于對(duì)蘆筍和獼猴桃的研究。例如羽峰,在蘆筍中趟咆,雌性缺少一種與絨氈層發(fā)育相關(guān)的基因,而突變的雄性缺少一種假定的雌性抑制基因梅屉,因而無法恢復(fù)雌雄同體值纱。
在此,我們研究了葡萄屬的性別決定區(qū)域(SDR)坯汤。約有70種野生葡萄都是雌雄異株的虐唠,表明該屬自起源以來,雌雄異株一直是保守的玫霎。栽培葡萄(Vitis vinifera ssp. vinifera; hereafter Vv vinifera)凿滤,葡萄的一種妈橄,已恢復(fù)為雌雄同株庶近,盡管其野生(Vitis vinifera ssp. sylvestris (hereafter Vv sylvestris))祖先是雌雄異株的。這種交配系統(tǒng)的轉(zhuǎn)變發(fā)生在大約8000年前的馴化時(shí)期眷蚓,可能是雄性(M)和雌性(F)單倍型之間發(fā)生了一次罕見的重組事件所導(dǎo)致的鼻种。因此,葡萄有三種類型的個(gè)體(Fig. 1a, b):(i)雌蕊減少的雄花沙热,沒有柱頭或花柱發(fā)育叉钥;(ii)雌花含有反折的花藥和能釋放不育花粉粒的雄蕊;(iii)栽培葡萄中的雌雄同花個(gè)體篙贸,其具有完美的花朵投队,帶有功能性的雌蕊和雄蕊,具有可育的花粉爵川。這三種類型由SDR區(qū)域中的基因型決定敷鸦。其中雄性類型為雄性和雌性單倍型(MF)的雜合子,雌性類型為純合子(FF),以及栽培葡萄(Vv vinifera)的雌雄同花要么是雌雄同花單倍型(HH)的純合子扒披,要么是雜合子(HF)值依。
之前的遺傳和基因組上的研究已經(jīng)確定了葡萄中SDR的大致邊界。在葡萄屬中碟案,SDR在遺傳上映射到2號(hào)染色體上約150 kbp的區(qū)域愿险,這其中包含15到20個(gè)基因。在野生葡萄(sylvestris Vv)中价说,該區(qū)域內(nèi)的多態(tài)性具有高度的連鎖不平衡辆亏,表明M和F單倍型之間存在很低或不存在重組。假設(shè)該區(qū)域包含由雙基因座模型預(yù)測(cè)的隱性雄性不育等位基因和顯性雌性不育等位基因鳖目,并且已通過基因表達(dá)比較分析嘗試對(duì)其進(jìn)行鑒定褒链。其中一個(gè)候選基因,腺嘌呤磷酸核糖轉(zhuǎn)移酶基因VviAPT3疑苔,在雄花的心皮原基中表達(dá)甫匹,表明其與雌蕊敗育有關(guān)。
直到最近惦费,葡萄的性別決定研究中兵迅,一個(gè)主要的限制是,栽培葡萄(Vv vinifera)的參考基因組僅代表部分組裝的F單倍型薪贫。最近的研究解析了四種SDR單倍型的部分序列信息恍箭,包括三種H單倍型和一種F單倍型。然而瞧省,盡管在這方面取得了重大進(jìn)展扯夭,但是由于缺乏M單倍型的信息,我們對(duì)SDR區(qū)域和性別決定因素的理解一直受到阻礙鞍匾。
為了填補(bǔ)這一空白交洗,我們逐步組裝了包括雌雄同花栽培葡萄、雄株和雌株野生葡萄在內(nèi)的9個(gè)二倍體基因組橡淑。所有這些基因組都是基于高覆蓋率的PacBio長(zhǎng)讀長(zhǎng)測(cè)序构拳。對(duì)于每個(gè)基因組,手動(dòng)校正了遺傳定義的單倍型中SDR區(qū)域梁棠,并已在雄株置森、雌株和雌雄同花個(gè)體的花朵發(fā)育早期和晚期測(cè)定了從該區(qū)域表達(dá)的轉(zhuǎn)錄本。有了這些廣泛的序列和表達(dá)數(shù)據(jù)符糊,我們比較了F凫海、H和M單倍型,以更好地定義SDR區(qū)域男娄,確定候選的性別決定基因行贪,并評(píng)估H單倍型是否源于重組事件把兔。
Results
性別特異性單倍型在整個(gè)葡萄屬中都是保守的
我們對(duì)8個(gè)葡萄品種的完整基因組進(jìn)行了測(cè)序和組裝,其中包括3個(gè)雌雄同花的栽培葡萄(Vv vinifera)品種(Merlot, Black Corinth seedless and Black Corinth seeded)瓮顽、4個(gè)野生葡萄品種(sylvestris Vv)(兩個(gè)雌株和兩個(gè)雄株)县好、和一個(gè)(V. arizonica)雄株。此外暖混,還對(duì)雄株圓葉葡萄(Muscadinia rotundifolia)的基因組進(jìn)行了測(cè)序缕贡,并將其作為葡萄雌雄異株的外群(Fig. 1c)。每個(gè)基因組都是基于單分子實(shí)時(shí) DNA 測(cè)序和 FALCON-Unzip從頭組裝拣播,產(chǎn)生部分倍型的二倍體基因組晾咪。我們還使用了包括赤霞珠(Cabernet Sauvignon)和金粉黛(Zinfandel)兩個(gè)可公開獲得的基因組,并對(duì)這兩個(gè)品種以相同的方法進(jìn)行了測(cè)序和組裝贮配。所有的二倍體組合都是高度連續(xù)的谍倦,并且大約覆蓋了預(yù)期單倍體基因組大小的兩倍(Supplementary Data 1)。通過HiC染色質(zhì)互作圖譜泪勒、光學(xué)圖譜和多種輔助組裝手段進(jìn)行輔助掛載和組裝昼蛀,赤霞珠(Cabernet Sauvignon)基因組的組裝得到進(jìn)一步改進(jìn),從而得到了全部19條染色體和兩個(gè)階段性拷貝hap1和hap2圆存。
通過將性別連鎖標(biāo)記的引物與赤霞珠2號(hào)染色體階段性拷貝hap1參考序列進(jìn)行比對(duì)叼旋,首次鑒定了SDR區(qū)域。然后將赤霞珠hap1拷貝中SDR區(qū)域的蛋白質(zhì)編碼序列與其他10個(gè)基因組組裝序列進(jìn)行比對(duì)沦辙,以識(shí)別同源區(qū)域夫植。接著,我們手工標(biāo)注了每個(gè)基因組中每個(gè)單倍型的SDR區(qū)域油讯,并根據(jù)已知的基因型(Fig. 1c)和已知的H vs. F單倍型結(jié)構(gòu)來指定性別類型(M详民、F或H)。通過這些方法陌兑,我們解決了20個(gè)葡萄品種的SDR單倍型(5H沈跨、12F、3M 單倍型)和M. rotundifolia的M和F單倍型诀紊。
所有的SDR單倍型都與赤霞珠hap1拷貝H單倍型比對(duì)谒出,以評(píng)估其結(jié)構(gòu)差異并鑒定性別特異性特征(Fig. 2; Supplementary Fig. 1)。不同性別類型邻奠,其長(zhǎng)度存在明顯差異。單倍型大小在約171.6-837.4 kbp之間(Fig. 2a-c)为居,但F單倍型(181.4 ± 10.2 kbp))明顯短于M (425.9 ± 274.6 kbp碌宴;Mann-Whitney test, P value?=?0.0008403)單倍型和H(289.2?±?7.4?kbp; P value?=?0.0002334)單倍型蒙畴。這些長(zhǎng)度差異反映了性連鎖結(jié)構(gòu)變異的存在(SVs; >50?bp)贰镣。例如呜象,12個(gè)葡萄F單倍型與H單倍型赤霞珠相比,共有8個(gè)大的缺失碑隆,總長(zhǎng)度為117.4 kbp(Fig. 2b)恭陡。這些與F單倍型連鎖的大部分缺失(62.9%)由轉(zhuǎn)座元件(TE)構(gòu)成,包括 LTR上煤、 Gypsy休玩、 Copia 和 MuDR 元件。同樣劫狠,相對(duì)于參考序列H單倍型拴疤,這3個(gè)M單倍型共享兩個(gè)大SVs,包括在4,802,134處的22.6 kbp插入和在5,021,983到5,052,079處的30 kbp缺失独泞。此外呐矾,V. arizonica 的M單倍型有一個(gè)獨(dú)特的約400 kbp的插入,M. rotundifolia 的M單倍型包含的倒置涵蓋了SDR區(qū)域的57%(Fig. 2a)懦砂。不同性別類型的SDR單倍型中基因含量不同蜒犯。20個(gè)葡萄的SDR單倍型共有13個(gè)SDR基因,其中2個(gè)SVs的基因含量發(fā)生了變化荞膘。如前人觀察的一致(Zhou et al)愧薛,F(xiàn)單倍型具有與H單倍型和Vv sylvestris 的M單倍型相關(guān)的SV,該單倍型刪除了兩個(gè)編碼TPR-containing蛋白的基因衫画。此外毫炉,與F單倍型相比,H型和M型單倍型中缺失一個(gè)黃素單加氧酶(FMO削罩,FLAVIN-CONTAINING MONOOXYGENASE)基因瞄勾。(Vitis and M. rotundifolia)真葡萄屬和圓葉葡萄屬植物的總體結(jié)構(gòu)和基因含量較為保守。盡管存在較大的倒置弥激,但M. rotundifolia的M型基因含量和順序與Vitis的M型相似进陡,M. rotundifolia的F型基因含量和順序與Vitis的F型基因含量和順序相同(Fig. 2d)。最后微服,在SDR的前60kbp范圍內(nèi)趾疚,H單倍型的結(jié)構(gòu)與F單倍型相似,但在該區(qū)域下游以蕴,其結(jié)構(gòu)上與M單倍型更相似(Fig. 2d)糙麦。
與性別連鎖的多態(tài)性影響蛋白序列
我們利用赤霞珠H單倍型的序列做比對(duì),來鑒定葡萄屬植物中與性別密切相關(guān)的單核苷酸多態(tài)性SNPs丛肮。所有的F-和M-相關(guān)的多態(tài)性都是在赤霞珠2號(hào)染色體中hap1拷貝的4801876到5061548的位置發(fā)現(xiàn)的(Fig. 3a; Supplementary Data 2; Supplementary Fig. 2)赡磅,這些區(qū)域隨后確認(rèn)并界定為SDR區(qū)域。共有1275個(gè)SNPs被12個(gè)葡萄F單倍型與H和M單倍型共享宝与,270個(gè)SNPs被3個(gè)M單倍型與F和H單倍型共享焚廊。有趣的是冶匹,M單倍型連鎖的SNP在SDR區(qū)域的前8 kbp中最密集(4801876-4809592區(qū)間包含176個(gè)SNPs),而第一個(gè)與F單倍型連鎖的SNP在M單倍型連鎖的SNP密集群下游約40 kbp處(4842196; Fig. 3a)咆瘟。雖然由于兩屬間的差異嚼隘,性別特異性SNP的數(shù)量有所減少,但在比較中加入圓葉葡萄單倍型后袒餐,性別特異性SNP的分布基本一致(Supplementary Fig. 3)飞蛹。
許多與性別連鎖的SNPs會(huì)改變編碼的氨基酸(Fig. 3b)∧淠耍總的來說桩皿,我們發(fā)現(xiàn)了6個(gè)與M單倍型連鎖的非同義SNPs:其中兩個(gè)在YABBY轉(zhuǎn)錄因子(TF)編碼的基因VviYABBY327上,兩個(gè)在醛縮酶編碼基因中幢炸,一個(gè)在海藻糖-6-磷酸酶(TPP)編碼基因中泄隔,還有一個(gè)在第三個(gè)FMO基因中。這些非同義的與M單倍型連鎖的SNPs代表了潛在的雌性不育突變宛徊。同樣的佛嬉,我們?cè)?0個(gè)基因中檢測(cè)到了89個(gè)F單倍型特異性的非同義SNPs(Supplementary Data 2)。這些非同義SNPs分布在下列基因中闸天,其中TPP(1)暖呕、VWINP1(1)、exostosin-coding gene(7)苞氮、3-ketoacyl-acyl carrier protein synthase III gene (KASIII)(3)湾揽、PLATZ TF-coding gene (PLATZ)(7)、first FMO gene(18)笼吟、the second FMO(26)库物、the third FMO(11)、the hypothetical protein VviFSEX(11)贷帮、VviAPT3(4)戚揭。其中3個(gè)SNPs在4個(gè)FMO基因的前兩個(gè)中引入了一個(gè)提前終止密碼子(Fig. 3e)。
為了更好地理解SDR區(qū)域的進(jìn)化歷程撵枢,進(jìn)一步鑒定雄性不育和雌性不育候選基因民晒,我們根據(jù)葡萄的序列構(gòu)建了每個(gè)SDR基因的系統(tǒng)發(fā)育樹(Fig. 3f; Supplementary Fig. 4)。在大多數(shù)SDR中锄禽,等位基因傾向于按性別分類潜必,聚類模式隨基因座的變化而變化(Fig. 3f; Supplementary Fig. 4)。從VviYABBY3到醛縮酶基因開始的4個(gè)基因的系統(tǒng)發(fā)育樹將除F和H單倍型序列外的大多數(shù)M單倍型序列聚集在一起沟绪,VviYABBY3和醛縮酶等位基因形成了將M與F和H單倍型同源序列分開的分支(Fig. 3f)刮便。這種模式從TPP開始轉(zhuǎn)變;對(duì)于TPP绽慈、VviINP1恨旱、exostosin、KASIII坝疼、PLATZ搜贤、三個(gè)FMO、假設(shè)的蛋白質(zhì)基因VviFSEX和VviAPT3钝凶,F(xiàn)單倍型序列聚集在M和H等位基因之外(Fig. 3f)鹏溯。這些系統(tǒng)發(fā)育與觀察到的性別特異性多態(tài)性是一致的(Fig. 3a, b)胡本,F(xiàn)-like H單倍型位于該區(qū)域的開始,M-like H單倍型位于該區(qū)域的結(jié)束(Fig. 2)。該區(qū)域邊緣的基因不會(huì)按性別進(jìn)行單倍型的分類瑰艘,這進(jìn)一步支持了我們對(duì)SDR邊界的推斷(Fig. 3f; Supplementary Fig. 4)⌒婪叮總之巍耗,這些觀察結(jié)果與通過醛縮酶和TPP基因附近的重組事件而出現(xiàn)的H單倍型一致,在那里性別特異性的聚類模式發(fā)生了變化(Fig. 3e)嗜诀。
VviINP1基因上的一個(gè)INDEL在所有雌性單倍型中都是保守的
除了SNPs之外猾警,我們還分別鑒定出156個(gè)和25個(gè)小的INDELs(≤50 bp),這些小INDELs是所有F和M單倍型相對(duì)于赤霞珠H參考序列所共有的隆敢。這些INDELs中只有兩個(gè)位于外顯子區(qū)(Supplementary Data 3):1) 第一個(gè)FMO編碼基因中的一個(gè)21bp的INDEL发皿,在H和M等位基因中引入了一個(gè)過早終止密碼子;2) 擬南芥INP1(AT4G22600)在葡萄中的同源序列上一個(gè)8bp的INDEL拂蝎,導(dǎo)致所有F等位基因移碼并引入一個(gè)提前終止的密碼子(Fig. 4a)穴墅。F單倍型上VviINP1等位基因中的一個(gè)8bp INDEL導(dǎo)致該蛋白序列被截?cái)酁?1個(gè)氨基酸(228 amino acids in H/M haplotypes)。因?yàn)樵趫A葉葡萄(M. rotundifolia)中的F單倍型中也發(fā)現(xiàn)了同樣的8 bp缺失(Fig. 4a)温自,這種F-特異性INDEL可能發(fā)生在葡萄和圓葉葡萄分化之前玄货,因此可能在葡萄中廣泛傳播。按性別類型對(duì)葡萄和圓葉葡萄的INP1蛋白進(jìn)行系統(tǒng)發(fā)育分析捣作,確定INP1等位基因的性別特異性(Fig. 4b; Supplementary Fig. 5)誉结。
INP1等位基因的性別特異性為估計(jì)M、F單倍型之間的分化時(shí)期和雌雄異株的潛在分化年限提供了可能券躁。我們計(jì)算了INP1的所有52對(duì)F和M等位基因之間的平均同義距離(Ds)為每個(gè)堿基0.0275個(gè)替換(95% 置信區(qū)間: 0.0258-0.0292)惩坑。假設(shè)一個(gè)世代時(shí)間為3年,每年每個(gè)堿基的核苷酸替代率為2.5 × 10-9也拜,我們推斷以舒,M和F等位基因大約在1650萬年前分化(95% 置信區(qū)間: 15.5-17.5),這個(gè)值在葡萄屬和圓葉葡萄屬之間估計(jì)分裂時(shí)間的不確定范圍內(nèi)慢哈。
為了進(jìn)一步研究VviINP1基因的性別特異性蔓钟,設(shè)計(jì)了PCR引物擴(kuò)增該基因的INDEL特異性等位位點(diǎn)。對(duì)另外7份栽培葡萄(HF和HH基因型)和兩個(gè)更遠(yuǎn)的中亞葡萄品種卵贱,V.piasezkii(雄株滥沫;MF)和V.romanetii(雌株侣集;FF)進(jìn)行了分析。推測(cè)功能性VviINP1等位基因只存在于含有H和M單倍型的基因型中兰绣,INDEL只存在于含有F單倍型的基因型中(Fig. 4c)世分。用同樣的 PCR 標(biāo)記對(duì)兩個(gè) F1群體進(jìn)行篩選,在Vv vinifera×?V. arizonica F1 群體的218個(gè)個(gè)體中缀辩,雄株102個(gè)臭埋,雌株100個(gè),不產(chǎn)生任何花序的16個(gè)臀玄;而Vv vinifera?×?Vv sylvestris F1群體由92個(gè)雄株瓢阴、78個(gè)雌株和8個(gè)無花序植株組成。兩個(gè) F1群體的性狀分離均為1:1健无,與 FF × MF 雜交結(jié)果一致(χ2?=?0.02, d.f.?=?1, P value?=?0.890; χ2?=?1.15, d.f.?=?1, P value?=?0.283)荣恐。在這兩個(gè)群體中,所有具有雌花的 F1個(gè)體都是假定無功能的 VviINP1等位基因的純合子睬涧。所有 F1代雄花都攜帶一個(gè)VviINP1的功能拷貝和一個(gè)非功能拷貝(Supplementary Figs. 6, 7; Supplementary Data 4?5)募胃。基于全基因組測(cè)序方法對(duì)120個(gè) Vv vinifera?×?V. arizonica F1群體的基因型進(jìn)行了重復(fù)性整體分析畦浓,證實(shí)了VviINP1基因8bp 的缺失以及SDR中的所有其他性別連鎖序列的多態(tài)性(Supplementary Fig. 8)痹束。最后,值得注意的是讶请,VviINP1的位置對(duì)應(yīng)于50份Vv vinifera(HF)材料的連鎖不平衡峰值(r2?=?0.77)(Fig. 3c)祷嘶,說明這個(gè)位點(diǎn)的重組受到抑制。
因?yàn)?em>INP1的功能性拷貝是玉米可育花粉發(fā)育所必需的夺溢,這些結(jié)果支持了8?bp缺失導(dǎo)致純合葡萄雌性不育的假設(shè)论巍,并可能是Vv sylvestris雌性花粉粒表面萌發(fā)溝缺失的原因。綜上所述风响,序列嘉汰、系統(tǒng)發(fā)育、關(guān)聯(lián)分析和功能證據(jù)表明状勤,一個(gè)包含8?bp缺失的VviINP1隱性等位基因影響雄花發(fā)育功能鞋怀,這使得VviINP1成為一個(gè)可能的雄性不育候選基因。
性別連鎖基因具有不同的表達(dá)模式
為了評(píng)估性別連鎖多態(tài)性對(duì)SDR基因調(diào)控的潛在影響持搜,我們?cè)谵D(zhuǎn)錄起始位點(diǎn)上游3 kb 區(qū)域內(nèi)尋找性別連鎖的TF結(jié)合位點(diǎn)(Fig. 3d; Supplementary Fig. 9; Supplementary Data 6)密似。在編碼含PPR蛋白VviYABBY3、醛縮酶葫盼、KASIII残腌、FMOs和VviFSEX基因的上游發(fā)現(xiàn)與M單倍型連鎖的TF結(jié)合元件。VviYABBY3啟動(dòng)子區(qū)的兩個(gè)與M單倍型連鎖的TF結(jié)合元件與開花和花發(fā)育有關(guān),其中包括短營(yíng)養(yǎng)期(SHORT VEGETATIVE PHASE抛猫,SVP)蟆盹,SVP 參與溫度調(diào)控開花時(shí)間,BES1-INTERACTING MYC-LIKE1(BIM1)邑滨,一種油菜素甾體信號(hào)成分日缨,參與擬南芥雄性生殖钱反。同樣掖看,我們鑒定了VviINP1、exostosin面哥、KASIII哎壳、PLATZ、FMOs尚卫、VviFSEX归榕、WRKY和VviAPT3上游F單倍型所特有的TF結(jié)合序列(Fig. 3d; Supplementary Data 6)。與此相反吱涉,所有F單倍型在VviAPT3啟動(dòng)子區(qū)附近都缺乏bHLH TFs和AGAMOUS-LIKE 3的TF結(jié)合位點(diǎn)(Supplementary Fig. 10a)刹泄。
其中一個(gè)WRKY基因,因其潛在的功能怎爵,而對(duì)性別特異性TF結(jié)合位點(diǎn)特別感興趣特石。在H和M單倍型中,WRKY啟動(dòng)子區(qū)有11個(gè)TF結(jié)合元件鳖链,而在所有的F等位基因中均不存在姆蘸。這些TF結(jié)合位點(diǎn)與影響擬南芥開花時(shí)間和發(fā)育的轉(zhuǎn)錄因子有關(guān)。性別特異性轉(zhuǎn)錄因子結(jié)合元件的顯著多樣性表明芙委,位于SDR之外的轉(zhuǎn)錄因子可能對(duì)SDR內(nèi)的基因進(jìn)行復(fù)雜調(diào)控逞敷,這可能受到環(huán)境因素的影響。此外灌侣,單倍型間轉(zhuǎn)錄因子結(jié)合位點(diǎn)的分布表明推捐,許多SDR上基因可能受到性別特異性的差異調(diào)控。
為了研究性別特異性調(diào)控侧啼,我們用RNA-seq定量分析雌雄同花Vv vinifera Chardonnay (HH)和雄花牛柒、雌花、Vv sylvestris DVIT3351.27(MF)和O34-16(FF)花芽的轉(zhuǎn)錄豐度慨菱。先前的研究已經(jīng)分析了 SDR 中的基因表達(dá)焰络,并比較了不同性別的花。然而符喝,這些數(shù)據(jù)是從花的早期發(fā)育階段取樣的闪彼,可能錯(cuò)過了性別決定的后期階段。因此,我們采集了花的三個(gè)發(fā)育階段: (i)生殖結(jié)構(gòu)的早期發(fā)育階段畏腕;(ii)花粉成熟前期缴川;(iii)開花期。測(cè)序reads被比對(duì)到赤霞珠基因組的兩個(gè)單倍型上并比較每個(gè)發(fā)育階段的個(gè)體之間的表達(dá)水平描馅。我們關(guān)注的是那些表現(xiàn)出性別特異性表達(dá)譜的基因把夸,例如:與雄花和兩性花相比,雌花中表達(dá)較高(或較低)的基因铭污。
在至少一個(gè)發(fā)育階段恋日,有十三個(gè)基因符合這個(gè)標(biāo)準(zhǔn)(Fig. 5a; Supplementary Data 7)。例如嘹狞,令我們吃驚的是岂膳,VviINP1在開花前后的雌花中的表達(dá)明顯高于雄花和兩性花(adjusted P value?≤?0.05)。同樣磅网,WRKY在雄花和兩性花中各發(fā)育階段的表達(dá)均高于雌花谈截。三個(gè)基因僅在一個(gè)時(shí)期呈現(xiàn)差異表達(dá): TPP,aldolase and beta-fructofuranosidase (BFRUCT)(Fig. 5a)涧偷。兩個(gè)基因在雄花中兩個(gè)或兩個(gè)以上發(fā)育階段表達(dá)增強(qiáng): VviAPT3在雄花三個(gè)發(fā)育階段表達(dá)增強(qiáng)簸喂,VviYABBY3在后兩個(gè)發(fā)育階段表達(dá)更高。VviAPT的結(jié)果與先前的研究一致燎潮,即高VviAPT3轉(zhuǎn)錄本豐度是Vv sylvestris雄花的心皮原基所特有的喻鳄,這表明VviAPT3在心皮敗育中起作用(Supplementary Fig. 10b)。值得注意的是跟啤,VviAPT3在雄花中的高表達(dá)在H和M單倍型等位基因是特異的诽表,而F等位基因在不同性別類型中的表達(dá)在各個(gè)發(fā)育階段都不斷降低(Supplementary Fig. 10b, c)。這表明M和H單倍型中隅肥,VviAPT3等位基因的表達(dá)水平或劑量可能影響性別決定竿奏。對(duì)于VviYABBY3,我們還通過將RNA-Seq的reads比對(duì)到DVIT3351.27參考基因組上腥放,證實(shí)了相對(duì)于F等位基因泛啸,雄性花中M等位基因的高表達(dá)是特異的(Supplementary Data 8)。鑒于VviYABBY3中的序列多態(tài)性與M單倍型是完全連鎖的(Fig. 3a)秃症,且該基因位于赤霞珠H單倍型的一部分候址,類似F單倍型(Fig. 2d),推測(cè)VviYABBY3的M等位基因可能與雌性不育有關(guān)种柑。
差異表達(dá)的 SDR 基因包括 TFs 和與激素信號(hào)相關(guān)的基因岗仑,這些基因可能在共表達(dá)網(wǎng)絡(luò)中發(fā)揮重要的調(diào)控作用。為了評(píng)估性別連鎖基因和其他基因組中可能影響發(fā)育的基因之間的關(guān)系聚请,我們進(jìn)行了跨發(fā)育階段的加權(quán)基因共同表達(dá)網(wǎng)絡(luò)分析(WGCNA)(Supplementary Data 9)荠雕。六組共表達(dá)基因(共6830個(gè)基因)與三種性別表型之一呈正相關(guān)或負(fù)相關(guān)(|Pearson correlation|?>?0.9稳其,P value?<?8e-11; Supplementary Fig. 11)。例如炸卑,1176個(gè)共表達(dá)基因的洋紅模數(shù)與雄性表型有關(guān)(Pearson correlation?=?0.97既鞠;P value?=?2e-16)。這個(gè)模塊在SDR區(qū)包含兩個(gè)基因盖文,分別編碼PPR-containing protein and VviAPT3嘱蛋。該模塊還包括與激素信號(hào)相關(guān)的基因,如與AtUGT85A1和AtUGT85A3同源的2個(gè)尿苷二磷酸糖基轉(zhuǎn)移酶(UGTs)五续,它們可能參與活躍的細(xì)胞分裂素穩(wěn)態(tài)洒敏。WRKY的表達(dá)位于紅色模塊(1512 genes;Fig. 5c)的中心(即高度相關(guān))返帕,與雌性性別決定呈負(fù)相關(guān)(Pearson correlation?=?-0.92桐玻;P value?=?6e-12)。該模塊包括一個(gè)對(duì)花器官發(fā)育必不可少的MADS-box基因荆萤,它是擬南芥SEPALLATA1 (SEP1;AT5G15800)的同源序列铣卡×淳拢總之,這些數(shù)據(jù)表明煮落,性別連鎖多態(tài)性影響某些SDR基因的調(diào)控敞峭,而且其中一些基因在參與性別決定和其他發(fā)育過程的共表達(dá)模塊中高度相關(guān)。
Discussion
葡萄中的雌雄異株是很有趣的蝉仇,因?yàn)槠咸烟偈巧贁?shù)古老的雌雄異株植物之一旋讹,在馴化過程中恢復(fù)為雌雄同體。從結(jié)構(gòu)上看轿衔,野生葡萄有完整的花(Fig. 1a, b)沉迹,但雄花和雌花分別缺少功能性雌蕊和花粉。正如對(duì)大多數(shù)被子植物所推測(cè)的那樣害驹,這些野生葡萄花很可能起源于雌雄同體的祖先鞭呕,雌雄異株是由獨(dú)立的、連續(xù)的雄性不育和雌性不育突變引起的宛官。在雙基因座模型下葫松,第一步是隱性雄性不育突變的進(jìn)化,第二步是顯性雌性不育突變的形成底洗。
通過將Vitis-SD單倍型映射到赤霞珠的H參考序列上腋么,我們發(fā)現(xiàn)了不同的M連鎖和F連鎖多態(tài)性模式。M連鎖多態(tài)性發(fā)生在從PPR蛋白啟動(dòng)子到TPP基因的5′區(qū)亥揖。相比之下珊擂,F(xiàn)連鎖多態(tài)性從TPP到VviAPT3(Fig. 6a)。在雌雄異株起源的雙位點(diǎn)模式下,顯性雌性不育等位基因可能是M單倍型所獨(dú)有的未玻,因此位于M單倍型與F和H單倍型不同的區(qū)域灾而。這縮小了在M連鎖多態(tài)性升高區(qū)域?qū)ふ掖菩圆挥稽c(diǎn)的范圍(Fig.3a–e)。值得注意的是扳剿,與M連鎖的SNPs聚集在VviYABBY3附近旁趟,VviYABBY3蛋白序列清楚地區(qū)分了M與F和H單倍型(Fig. 3f)。此外庇绽,VviYABBY3還含有兩個(gè)M-特異性TF結(jié)合位點(diǎn)锡搜,在花發(fā)育過程中表現(xiàn)出M-連鎖基因表達(dá)模式(Fig. 5a)。因此瞧掺,我們推測(cè)耕餐,向雌雄異株轉(zhuǎn)變的關(guān)鍵步驟之一,要么是由VviYABBY3蛋白的氨基酸變化和/或VviYABBY3基因的上調(diào)引起的辟狈,從而在雄花中導(dǎo)致雌性不育肠缔。關(guān)于YABBY基因家族的功能信息與這一假說是一致的。在擬南芥中哼转,YABBY基因參與了植物花器官和側(cè)生器官的發(fā)育明未,尤其是心皮和胚珠外珠被的發(fā)育。雖然VviYABBY3還沒有被闡釋壹蔓,但V. pseudoreticulata VpYABBY1和VpYABBY2在擬南芥中的表達(dá)(以及VvYABBY4在番茄中的表達(dá))暗示了這些基因在葉和心皮發(fā)育中的作用趟妥。
類似地,F(xiàn)連鎖多態(tài)性定義了SDR的一個(gè)區(qū)域佣蓉,該區(qū)域可能存在假設(shè)的隱性雄性不育突變披摄。從TPP到VviAPT3,SDR的后一部分存在F連鎖多態(tài)性(Figs. 3 and 6a)勇凭。在該區(qū)域的基因中疚膊,WRKY和VviINP1是最值得注意的。與雄花相比套像,WRKY基因在雌花中的表達(dá)較差(Fig. 5a)酿联,并且是與雌花性別決定呈負(fù)相關(guān)的共表達(dá)模塊中的一部分(Fig. 5c),因此從理論上講夺巩,WRKY的表達(dá)可能導(dǎo)致雄性不育贞让。然而,在我們看來柳譬,VviINP1基因中的8bp缺失才是導(dǎo)致雄性不育的最可能原因(Fig. 4a)喳张。這種純合子缺失導(dǎo)致的整個(gè)葡萄屬F等位基因移碼和密碼子的提前終止(Fig. 4c),表明其在葡萄種植史中一直保持著美澳。INP1參與了葡萄和玉米花粉孔形成销部,葡萄功能缺失突變可能解釋了雄性不育花粉的形成摸航。所有F1代雄性至少含有一個(gè)VviINP1功能基因(Fig. 4c; Supplementary Figs. 6 and 7),這表明如果VviINP1中的8bp缺失導(dǎo)致雄性不育舅桩,那么其則為隱形等位基因酱虎。特別是考慮到我們的假設(shè),即缺失事件使VviINP1蛋白的F等位基因失去功能擂涛,但為什么VviINP1在雌花中的表達(dá)更高读串,目前尚不清楚(Fig. 5a)。一種可能是高表達(dá)構(gòu)成了一種補(bǔ)償效應(yīng)撒妈,類似于CRISPR基因敲除的報(bào)道恢暖。鑒于我們假設(shè)VviINP1缺失導(dǎo)致雄性不育,未來的一個(gè)重要步驟將是功能驗(yàn)證狰右,將純合子缺失改造成雌雄同體產(chǎn)生雌性花杰捂。
與VviINP1一樣,VviINP3位于SDR的后一部分棋蚌,并且具有F連鎖多態(tài)性嫁佳,因此其位置可能在雄性不育中發(fā)揮了作用。然而附鸽,VviAPT3在雄花中表達(dá)較高脱拼,其共表達(dá)模式與雄花性別有關(guān)。這些結(jié)果與Coito等人描述的基因表達(dá)模式一致坷备。這些數(shù)據(jù)表明VviAPT3參與了花的發(fā)育和性別決定,但它的作用機(jī)制使復(fù)雜的情臭,需要進(jìn)一步的研究來充分理解省撑。
據(jù)推測(cè),M和F單倍型之間的重組導(dǎo)致H單倍型的還原俯在。若干證據(jù)支持H單倍型產(chǎn)生于一個(gè)重組事件的假設(shè)竟秫,包括它們與SDR第一部分的F個(gè)單倍型和SDR后一部分的M個(gè)單倍型的中間長(zhǎng)度、結(jié)構(gòu)和序列的相似性(Fig. 6a)跷乐。根據(jù)我們的數(shù)據(jù)肥败,我們也可以定位假設(shè)的重組事件。系統(tǒng)發(fā)育證據(jù)表明愕提,醛縮酶與TPP基因發(fā)生重組馒稍,多態(tài)性信息表明TPP基因可能發(fā)生重組,因?yàn)樵摶蛐蛄邪琈-連鎖和F-連鎖的非同義SNPs(Figs. 3a–f, 6b)浅侨。然而纽谒,我們注意到,有證據(jù)表明H單倍型在馴化的葡萄中起源不止一次如输,著表明H單倍型中可能存在不同的重組斷點(diǎn)鼓黔。
最后央勒,我們還提出了一個(gè)關(guān)于重組的問題:如果F和M等位基因可以重組,那么是什么讓這兩個(gè)單倍型保持了這么長(zhǎng)時(shí)間的不同?既然自該屬起源以來澳化,雌雄異株就一直在野外存在崔步。這是一個(gè)特別重要的問題,因?yàn)楸蛔又参镏写菩郛愔晗∩偈怯捎诤苋菀谆謴?fù)到雌雄同體缎谷。我們推測(cè)M和F單倍型之間的重組是由葡萄屬SDR的至少三個(gè)特征決定的井濒。首先,性別決定基因的緊密聯(lián)系可能僅僅反映了生理上的親密關(guān)系慎陵。如果我們關(guān)于VviYABBY3和 VviINP1是不育基因的假設(shè)是正確的眼虱,那么重組事件必須發(fā)生在< 100kb席纽,這樣就可以將這兩個(gè)基因分開润梯,從而產(chǎn)生H單倍型。其次扫倡,并不是所有的重組活動(dòng)在自然界中都是成功的:只有50%正確的重組體會(huì)成為雌雄同株(Fig. 6b)锥累,而且可能會(huì)有與雌雄同株相關(guān)的適應(yīng)性代價(jià)语淘。最后蹬挺,我們推測(cè)M和F單倍型在結(jié)構(gòu)和長(zhǎng)度上的差異主要是由TE在基因間空間的積累造成的溯泣,限制了重組客给,因?yàn)榈任换蜷gTE含量的差異會(huì)減緩重組的速度池充。在這種情況下,M. rotundifolia的倒位作用相對(duì)于F單倍型中57%的M單倍型,可能是一種特別有效的威懾设凹,因?yàn)榈刮豢赡苁侵亟M的障礙钻洒。我們懷疑這三個(gè)特征導(dǎo)致了野生葡萄雌雄同體的明顯缺失航唆。
補(bǔ)充
關(guān)于泛基因組及基因組組裝退腥,近期在NG上發(fā)表的兩篇文章與本文有點(diǎn)類似,一篇來自黃三文團(tuán)隊(duì)疾就,該研究首次完成了雜合二倍體馬鈴薯的單倍體型組裝猜敢,獲得了兩套染色體的基因組序列鼠冕,并在此基礎(chǔ)上揭示了雜合基因組內(nèi)豐富的序列變異陨闹、等位基因表達(dá)差異、甲基化修飾差異以及有害突變的分布模式乡数。另一篇來自康奈爾大學(xué)Boyce Thompson Institute費(fèi)章君團(tuán)隊(duì),該研究通過三代基因組測(cè)序手段對(duì)栽培蘋果 (Malus domestica cv. Gala)及其兩個(gè)主要的祖先種野生蘋果(M. sieversii 和 M. sylvestris)進(jìn)行基因組測(cè)序和組裝玖翅,同時(shí)對(duì)91個(gè)蘋果種質(zhì)進(jìn)行泛基因組研究翼馆,全面系統(tǒng)地解析了蘋果的起源、馴化歷程和遺傳學(xué)基礎(chǔ)金度。兩篇文章均涉及到雜合二倍體基因組的組裝应媚,均采用了Pacific Bioscience Sequel II platform平臺(tái)的HIFI模式〔录基于不同的單倍型中姜,結(jié)合單核苷酸多態(tài)性(SNPs)及結(jié)構(gòu)變異將長(zhǎng)測(cè)序讀長(zhǎng)拆分,然后分別組裝成contigs跟伏,再結(jié)合其他輔助手段掛載丢胚。
Haplotype-resolved genome analyses of a heterozygous diploid potato
Sun, X., Jiao, C., Schwaninger, H. et al. Phased diploid genome assemblies and pan-genomes provide insights into the genetic history of apple domestication. Nat Genet (2020). https://doi.org/10.1038/s41588-020-00723-9
Phased diploid genome assemblies and pan-genomes provide insights into the genetic history of apple domestication
Zhou, Q., Tang, D., Huang, W. et al. Haplotype-resolved genome analyses of a heterozygous diploid potato. Nat Genet 52, 1018–1023 (2020). https://doi.org/10.1038/s41588-020-0699-x