An enormous Paris polyphylla genome sheds light on genome size evolution and polyphyllin biogenesis
——寬瓣重樓巨型基因組揭示基因組大小進化和重樓皂苷合成
原文鏈接:https://www.biorxiv.org/content/10.1101/2020.06.01.126920v1
本文由中國科學(xué)院西雙版納植物園等單位于2020.06發(fā)表于bioRxiv丹喻,本文亮點在于組裝物種“寬瓣重樓”屬迄今為止最大的基因組:82.55Gb。
背景介紹
寬瓣重樓(Paris polyphylla var. yunnanensis)是黑藥花科重樓屬的變種碍论,寬瓣重樓是一味傳統(tǒng)中藥材,其特有的生物活性成分重樓皂苷具有止血柄慰、鎮(zhèn)痛、消腫先煎、抗感染功效贼涩,收錄在《中國藥典》,我國有40多種以寬瓣重樓根莖為原料的商品藥薯蝎。
寬瓣重樓株高不超過1米,基因組大小卻有82.55G左右占锯,是人類基因組的27倍袒哥。黑藥花科植物基因組大小變化范圍達230倍,是研究基因組大小變化的理想模型消略,破譯寬瓣重樓基因組對研究基因組大小進化以及重樓皂苷生物合成通路具有重要意義胎撤。
該研究完成了迄今為止最大的基因組組裝巫俺,揭示了寬瓣重樓巨型基因組形成的原因肿男,鑒定到一批與重樓皂苷生物合成通路相關(guān)的候選基因介汹。
材料方法
本文用到的主要測序技術(shù)——組裝部分:BGISEQ-500 (10.25T却嗡,124X),10xGenomics(1.79T嘹承,21X)窗价;輔助注釋:PB三代全長轉(zhuǎn)錄組(55.23G);其他部分:二代RNA-seq赶撰,代謝物含量舌镶。
結(jié)果部分
1、基因組組裝和注釋結(jié)果
Survey結(jié)果顯示基因組大小為82.55G(流式結(jié)果為53.61G)豪娜,SOAPdenovo2進行基因組組裝餐胀,從頭組裝出70.18G大小的寬瓣重樓基因組草圖,這是迄今為止最大的基因組組裝瘤载;相比已發(fā)表的歐非肋突螈(19.38G否灾,Scaffold N50 1.14Kb)和歐洲云杉(19.6G,Scaffold N50 4.87Kb)鸣奔,寬瓣重樓組裝有顯著提升墨技,Scaffold N50達到21.56Kb; 預(yù)測34,257個基因挎狸,BUSCO評估完整性89.6%扣汪。
2、基因家族分析
11個物種構(gòu)建系統(tǒng)進化樹锨匆;3038個基因家族發(fā)生了擴張崭别,3636個基因家族發(fā)生了收縮,擴張基因參與萜類生物合成和植物病原互作恐锣,可能參與皂苷合成及生物非生物脅迫反應(yīng)茅主。PSMC分析顯示,寬瓣重樓有效群體大小可能在10萬年到1萬年前急劇下降到底部土榴,與這段時間海平面(藍)和地表溫度(黃)的上升相一致(圖d诀姚,國家氣候數(shù)據(jù)中心http://www.ncdc.noaa.gov/)。環(huán)境變化可能是影響重樓有效種群數(shù)量的重要因素玷禽。
3赫段、基因組擴張及種群歷史
Ks分析沒有檢測到WGD事件,說明WGD可能和基因組大小無關(guān)矢赁;重復(fù)序列比例69.53%瑞佩,57.86G,其中 62.50% 是長末端重復(fù)(LTR)轉(zhuǎn)座元件坯台,可能與基因組大小有關(guān);總結(jié)了90個重要系統(tǒng)進化地位的基因組大小瘫寝、TEs和LTRs的百分比蜒蕾,結(jié)果表明稠炬,除被子植物中黑藥花科的重樓屬和延齡草屬外,大部分巨大的基因組屬于裸子植物咪啡;幾乎所有的大基因組(>5G)都含有較高比例的TEs和LTR首启,比如銀杏、挪威云杉等撤摸;在普通基因組(<5G)中毅桃,TEs的比例分布沒有偏向性,與基因組大小無關(guān)准夷,例如钥飞,美洲藜(1.58G基因組)和玉米(2.5G基因組)中的TEs含量分別高達77.20%和69.06%。
4衫嵌、?LTR進化
Ty3 / Gypsy超家族(45.69%)最豐富读宙,Ty1 / Copia豐富(9.99%)次之;選擇銀杏楔绞、玉米结闸、水稻和擬南芥,使用逆轉(zhuǎn)錄酶基因的結(jié)構(gòu)域構(gòu)建Ty3/ Gypsy和Ty1/ Copia系統(tǒng)進化樹酒朵。 Ty3 /Gypsy可以分為三個進化枝桦锄,每個進化枝包含銀杏,表明重樓基因組的Ty3/ Gypsy可能是從古老的裸子植物進化而來蔫耽。發(fā)現(xiàn)重樓3個Ty3/ Gypsy進化枝顯著擴張结耀,其插入時間顯示兩次爆發(fā)時間(2.2MYA和10.5-11.3MYA),表明所有Ty3/ Gypsy亞型都經(jīng)歷兩次擴張(圖b)Ty1/Copia分成5枝针肥,4枝是重樓特有的饼记,1枝是5個物種共有的。
5慰枕、 重樓皂苷生物合成
兩種重樓皂苷:薯蕷皂甙元和偏諾皂苷元(重樓特有)具则;營養(yǎng)期、開花期具帮、結(jié)果期和休眠期的根莖博肋、葉、莖蜂厅、花和果實HPLC檢測重樓皂苷匪凡,檢測到5種皂苷,其中薯蕷皂甙元衍生物占90%掘猿,薯蕷皂甙元之前證實是CYP450酶和UGT參與合成病游。轉(zhuǎn)錄組結(jié)果進行WGCNA,共鑒定到259個CYP450基因,其中8個已被證實參與薯蕷皂甙元合成衬衬,110個在相同模塊中(M35)买猖,顯著富集在類固醇生物合成通路,構(gòu)建共表達網(wǎng)絡(luò)( P450紅色滋尉,UGT綠色)玉控,和重樓皂苷濃度相關(guān)(p<0.01,b黃色)狮惜。
本文基因組大是個極大的亮點高诺,可惜的是沒有使用三代技術(shù)測序組裝,如果加上三代效果一定會好碾篡。另外可能是由于基因組太大虱而,也沒有使用Hi-C掛載至染色體。待到文章正式發(fā)表時再看雜志及影響因子耽梅。
植物基因組除了比較基因組分析里的常規(guī)分析薛窥,還可做一些個性化分析。進化地位眼姐,如無油樟诅迷;開花特性,花發(fā)育的MADSbox基因花香花色等众旗;基因組特征:倍性罢杉、重復(fù)序列憨琳、復(fù)制事件赴蝇;環(huán)境適應(yīng)性:抗逆、高原和極地杠愧、共生和寄生利朵;特殊刺激代謝產(chǎn)物等等律想。
資源來源于網(wǎng)絡(luò),侵刪绍弟。